基于EMM中文抽词算法的XMARC主题信息挖掘

来源 :情报学报 | 被引量 : 0次 | 上传用户:zuo541018125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为"词首+长词匹配+短词推进"自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间.最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性.
其他文献
本期股市动态30指数收于9207点,较上期上涨2.29%,同期上证指数上涨2%,创业板指上涨2.03%。成立以来股市动态30指数下跌8.01%,同期上证指数下跌9.93%,创业板指下跌23.07%。成
文化治理作为一种柔性的力量和隐形的因素,是建设共建共治共享美好生活的重要手段和载体。新时代构建社会主义文化治理体系的方法论,是在实践基础上的合目的性与合规律性的辩
竞争性选拔党政领导干部是组织工作的重要手段,具有科学性和合理性。但在实际操作中往往出现“高分低能”问题。主要表现在以分取人,一考定乾坤;会考的不会干,干考分离;德能绩考察
俗话说,天有三宝日月星,人有三宝精气神。这"精、气、神"就是一种激情,是面对机遇敢于抢抓、面对艰险敢于探索、面对落后敢于奋起、面对竞争敢于拼搏的责任和勇气。从严治党进
兴趣是一种巨大的激励学习的潜在力量。在教学中,当一个学生对他所学的知识发生兴趣时,就会调动自己的一切潜能积极、主动、愉快地去学习,而不会感到是一种沉重的负担。教育