基于社会标注质量的文本分类模型框架

来源 :计算机应用 | 被引量 : 9次 | 上传用户:jy02191348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估。在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量。同时采用支持向量机分类算法进行分
其他文献
以西南地区一座曲线高墩连续刚构特大桥为计算实例,介绍该桥的设计信息,并基于空间有限元分析,介绍该桥0号块产生扭转应力组合情况、各工况下结构最大扭矩值及最不利工况下0号块
为给评价者提供一种定量的评价需求文档质量的方法,给出了需求文档的重要质量属性,提出了将模糊评价方法运用于需求文档质量评价,从而降低结论的主观性,提高结论的可信度和说服力
马鞍山长江大桥南锚碇采用沉井基础,沉井入土深度超过50m,其施工采用“3次接高,3次下沉”的工艺:第1次下沉采用降排水措施,第2次下沉采用半排水措施,第3次下沉采用不排水措施。在沉
结合重庆东水门长江大桥和千厮门嘉陵江大桥渝中区连接隧道小净距段施工,采用Hoek-Brown 强度准则估算出节理岩体的力学参数,建立基于Hoek-Brown 强度准则的有限元分析模型,对隧