基于伪相关反馈模型的领域词典生成算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lajiub1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词典中,重新检索,如此迭代,直到生成的领域词典达到预先设定的规模。实验表明,本算法经过若干次迭代后生成的领域词典准确率高于已有领域词典生成算法。
其他文献
现有的文本聚类方法难以正确识别和描述文本的主题,从而难以实现按照主题对文本进行聚类。本文提出了一种新的基于主题的文本聚类方法:LFIC。该方法能够准确识别文本主题并根据
“十二五”期间,中国面临经济增长模式转型的艰巨任务。林毅夫、刘志彪等学者研究发现,我国各省份间存在的市场分割是阻碍经济增长模式转型的重要因素之一,具体表现为:一方面,由于
改革开放30多年来,政府不断实施自我革命,规范和约束行政权行使。特别是20世纪90年代以来,与建立和完善社会主义市场经济体制相适应,依法行政逐渐成为政府行为的基本准则,行
在文本分类中,为了降低计算复杂度,常用的特征选取方法(如IG)都假设特征之间条件独立。该假设将引入严重的特征冗余现象。为了降低特征子集的冗余度,本文提出了一种基于最小冗余原
随着财政国库管理制度改革和非税收入征管改革的深入,财政资金核算和管理逐步高度集中,支付方式转变为网上运行,确保财政资金安全的任务更加突出。(一)进一步增强财政资金安全
梨状肌综合征是引起干性坐骨神经痛常见原因之一,我科运用小针刀治疗梨状肌综合征20例获满意疗效,现介绍如下.
有机磷农药中毒是基层医院常见的急症,其中重度有机磷农药中毒抢救难度大,并发症严重,死亡率高.5年来,我院共收治重度有机磷农药中毒82例,抢救成功率达81.7%.现报告如下.1临