一种基于维基百科的中文短文本分类算法

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:haoliu1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
其他文献
<正>国务院2005年颁布《疫苗流通和预防接种管理条例》(以下简称《条例》)将疫苗分为两类:第一类疫苗是指政府免费向公民提供,公民应当依照政府的规定受种的疫苗;第二类疫苗
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:分析急诊死亡病人的临床特点,探讨早期影响因素及防治措施.方法:回顾性分析近5年来我院急诊内科急性死亡病人227例临床资料.结果:大部分死亡患者都存在诱因、忽视病情、
2000年1月21日,美国总统克林顿在加州理工学院正式宣布一项新的国家计划——国家纳米技术计划(NNI)。该计划被克林顿做为联邦政府科技研究与开发的第一优先计划。克林顿把联
从理论上和实践上否定了过去对炉拱原理的一些传统观点和看法。探讨了双人字形炉拱的原理和特性。说明了在其应用中可能发生的微爆燃问题及抗微爆结构。
以Na2SiO3&#183;9H2O、NaAlO2和CaCl2为原料,采用水热法将溶液中的铝转化成水化石榴石沉淀进行脱铝。通过对水热温度160℃、时间1~16h条件下得到的粉体进行X射线衍射和扫描电
伴随着《基础教育课程改革纲要(试行)》等新课程改革指导性文件的颁布,我国教育界第八次新课程改革正式启动。这次新课改从课程改革的目标、课程结构、课程标准、教学过程、
<正>2018年4月27日,上海中医药大学科技人文研究院《中医药文化》编辑部主办的第三届学术工作坊在沪成功召开,本次学术论坛由来自英国、新加坡及我国不同地区共计30余人,共同
在文化自信的重要性被提升到一个新的高度的时代背景下,红色旅游的文化魅力愈加凸显。随着我国社会经济的发展和社会主要矛盾的转化,红色旅游与文化产业融合发展已经成为了新
目的 探讨尿沉渣分析仪应用于腹膜透析液常规细胞检测的方法,并使之具有快速可行、结果 准确、操作简便的特点.方法 使用UF1000i尿沉渣分析仪分别对101例腹膜透析液标本进行