Keyword Extraction Based on tf/idf for Chinese News Document

来源 :武汉大学学报:自然科学英文版 | 被引量 : 0次 | 上传用户:flysky1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词抽取是信息检索的一个重要研究话题。这篇论文基于分析新闻文件的语言学特征在中国新闻文件给了关键词的说明;然后与多策略基于 tf/idf 建议了一个新关键词抽取方法。途径选择了 uni- 的候选人关键词,双性人 -- 并且 tri- 克,;然后根据他们的词法人物的意见定义特征;上下文信息。而且,论文建议了几策略修改从词分割得到的不完全的词;在新闻文件发现未知潜在的关键词。试验性的结果证明我们的建议方法罐头显著地超过基线方法。我们也把它用于回顾的事件察觉。试验性的结果出现精确性;回顾的事件察觉能显著地被改
其他文献
由于数据的数量一检验的标志需要很大,它减少审计特征并且忽视冗余的特征的 isnecessary。因此,减少 TCP/IP 的表演基于决定树 rule-basedstatistical 方法(数据终端就绪) 展示
上升计划是 Biorthogonal 小浪的特定设计的构造,认识到小浪的一个快、有效的方法转变,它提供大量申请并且高效地与它的特别框架减少计算时间。这篇论文瞄准介绍第二产生小浪,以
用 Java,使 Java 能的网;面向对象的编程技术,一个框架被设计多快速在内部网上组织计算机系统完成蒙特卡罗模拟 parallelizing。高效的计算环境在网服务者被嵌入因此它能更容易
A new type in situ Cr7C3/γ-Fe ceramal composite coat-ing was fabricated on substrate of hardened and tempered grade C steel by plasma cladding with Fe-Cr-C all
就常常在象电线转移数据库那样的大数据库数据增加而言,增长聚类算法在数据挖掘(DM ) 起一个越来越重要的作用。然而,很少传统的聚类算法不能仅仅处理范畴的数据,而且清楚地解释
这篇论文分析电子获得(电子获得) 在在电子市场的一个制造商和 N 供应商之间的过程。我们基于拍卖理论用一般合同校对那,我。e。批发价格合同,不完成由制造商和赢的供应商组成
治好的反应;环氧树脂 E-44,芳香族氨为修改了二氰氨的反应机制被用作治好的试剂,借助于微分扫描被调查热量测定(DSC ) 。结果证明修改二氰氨最好比为环氧树脂 E-44 的未修改的二
为了减轻可伸缩性问题,由增加的网引起了用;变化用户的兴趣,这篇论文论述一个新奇的网用法采矿算法 -- 增长的网用法采矿算法基于活跃蚂蚁殖民地聚类。第一,关于方向选择的活跃运
大兴安岭地区建设全国低碳经济示范区作为国家级区域性战略规划具有重要的地位。大兴安岭国家级低碳经济示范区建设重点应从低碳产业建设、低碳能源开发利用、碳汇林业发展、