基于信息熵和词频分布变化的术语抽取研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zmf0140
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分别研究了基于信息熵和基于词频分布变化的术语抽取方法的情况下,该文提出了一种信息熵和词频分布变化相结合的术语抽取方法。信息熵体现了术语的完整性,词频分布变化体现了术语的领域相关性。通过应用信息熵,即将信息熵结合到词频分布变化公式中进行术语抽取,且应用简单语言学规则过滤普通字符串。实验表明,在汽车领域的语料上,应用该方法抽取出1 300个术语,其正确率达到73.7%。结果表明该方法对低频术语有更好的抽取效果,同时抽取出的术语结构更完整。
其他文献
一个社会的大众传媒构成一个社会的媒介环境。新媒介技术的产生和普及,社会主导媒介的兴衰更替,导致一个社会的媒介矩阵重构,从而对社会的媒介环境以及生存演化于其中的社会
从市场结构理论体系出发,沿用该体系惯用的研究方法,结合信息产业部和专业咨询机构的统计数据以及当前该行业的相关法律政策,从我国手机产业的市场集中度、产品差别化和进入
通过随机抽样抽取非民族地区的《北京日报》近三十年来关于少数民族报道进行内容分析和文本分析,旨在考察非民族地区的媒体如何再现少数民族形象。主要发现有:少数民族报道总
50年一遇的特大洪水将曼谷三面围住,而另一面是正处于涨潮期的大海。莫非这座拥有上千万居民的大都市,要去印证好莱坞大片《未来水世界》的预言?$$    曼谷市中心高楼密集,市
报纸
目的:评价从植物假马齿苋中提取的单体化合物bacopaside I的抗抑郁、抗老年痴呆的药效,并分别探讨其改善抑郁及老年痴呆症的作用机制。方法:1.抑郁症模型模型组与药物处理组分别
分析了某型飞机光电雷达的工作过程 ,提出了一种基于虚拟仪器技术的光电雷达电子部件性能检测及故障诊断设计方案。通过对电子部件所有信号的实验测试和故障树结构分析 ,阐述
介绍了铝箔生产过程中皱折缺陷的形貌、分布,分析了皱折产生的原因,探讨了减少皱折缺陷的措施。
随着P2P技术和流媒体技术的不断发展以及社会经济的变迁,网络视频媒体遭遇了冰火两重天的经历,2005年、2006年发展迅猛,2008年受世界金融危机影响,数量锐减至近20家。同时,网
本文从利益相关者参与治理和利益相关者关系管理两方面构建了利益相关者权益保护指数。以此为依托,实证分析了中国上市公司利益相关者权益保护与公司价值之间的关系。研究表
目的 研究大骨节病的始动病因。方法 对大骨节病既往的生物地球化学说(低硒说)、水中有机物中毒说、粮食真菌毒素中毒说3种病因说及我们发现的病毒病因说进行同步研究,探讨