【摘 要】
:
为了解决词频统计文本表示方法中词语间语义信息缺失的问题,在考虑文本中词语上下文语境和语义背景信息的基础上,提出了一种新的中文文本表示模型——文本语义图.该方法利用
【基金项目】
:
国家自然科学基金资助项目(JJ0500092301);中央高校基本科研业务费资助项目(K50510230003)
论文部分内容阅读
为了解决词频统计文本表示方法中词语间语义信息缺失的问题,在考虑文本中词语上下文语境和语义背景信息的基础上,提出了一种新的中文文本表示模型——文本语义图.该方法利用维基百科作为知识背景计算文本中实意特征词语的语义关联,将具有较强语义关系的词语合并成词包作为图的节点,节点权值用词包所包含词语的数目及词频计算;不同词包中词语间的上下文关系作为图的有向边,有向边权值用其邻接节点的最大权值表示.该模型在较大程度地保留文本中词语上下文信息的同时强化了词语间语义内涵.通过中文文本分类实验,文本语义图分类方法相对于支持向量机分类效率提升了7.8%,同时错误率减少了1/3,且表现出更好的稳定性.实验结果表明在文本分类应用中,文本语义图模型能够有效地表示文本内容.
其他文献
目的:急性髓系白血病(acute myeloid leukemia, AML)是一类由造血细胞恶性变引起的具有高度异质性的血液病,产生原因主要是骨髓中髓系细胞的分化成熟障碍、凋亡减弱以及恶性克
目的探讨直肠内推移瓣修补治疗高位肛瘘的临床效果。方法选取2017年10月~2018年6月普宁华侨医院收治的174例高位肛瘘患者作为研究对象,随机分为对照组及治疗组,每组各87例。
随着科技的进步和社会的发展,我国的金融业发展也十分迅猛。房地产金融是关系老百姓住房问题的重要金融类别。但是在金融全球化的大环境下,当前的房地产金融在实际发展过程当
为加强新形势下加强交通运输企业文化建设,要认识到当前交通运输企业文化建设存在的问题,要处理好交通运输企业文化建设中存在的几个关系,并强化员工对企业文化的认同。
目的:观察联合使用参附注射液和苦碟子注射液治疗慢性阻塞性肺疾病(COPD)合并慢性呼吸衰竭患者的临床疗效。方法:将50例慢阻肺合并呼吸衰竭患者随机分为治疗组和对照组,为治
目的探讨小剂量螺内酯治疗冠心病慢性心力衰竭(CHF)的临床疗效及安全性。方法将收治的慢性心力衰竭患者124例按随机数字表法分为研究组和对照组,各62例。其中对照组采用常规
<正>春天是万物复苏的季节,人体的阳气开始升发,肝阳、肝火、肝风也随着春季阳气的升发而上升,阴血则相对不足。春季养生应顺应阳气升发的特点,饮食起居都顺肝之性,助益脾气,
<正>戛纳电影节每年五月在法国的戛纳举行。在电影节七十年的历史里,有一个人为电影节的明星服务超过五十年,体会着电影节的种种变化。他就是戛纳巴里尔·马杰斯迪克酒店的礼
本文对拉威尔《波莱罗》与肖斯塔科维奇《第七交响乐》第一乐章的配器手法进行了比较,通过详细的乐器动态配置图表,总结了二位作曲家在配器上对"渐强"思维处理的共性之处,值得
目的评价心肌型脂肪酸结合蛋白(H-FABP)对急性肺栓塞(APE)患者早期危险分层的预测价值。方法 2011年9月~2012年11月收治的APE患者60例,其中高危组14例、中危组26例和低危组20