基于混合策略的公众健康领域新词识别方法研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:band420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]从互联网公众查询数据中发现公众使用的健康术语,为建立公众健康术语与医学专业术语的映射提供基础,进而优化健康类知识服务平台的知识组织与管理性能.[方法/过程]设计规则与N-Gram相结合的健康术语新词的识别模型,采集公众查询数据,开展实验验证,通过多次实验,逐步完善过滤语料集合,结合人工判读,不断优化并验证方案的有效性.[结果/结论]从互联网中公众提问句抽取出规则,结合统计算法进行公众使用的健康类新词抽取,该技术方法对识别公众使用的健康术语具有一定的通用性,能为建立公众术语与医学术语映射提供数据基础.实验结果表明:基于规则进行公众日志数据预处理,能为后续的实验方案提供较好的预处理文本,而采用N-Gram及各种过滤规则结合的术语识别方法,能较好地识别发现短文本中的新词.
其他文献
摘 要:近年来,随着城乡建设速度加快,人口越来越集中,饮水难的问题也逐渐凸显,尤其是在一些岩溶地区,找水南成为制约当地经济发展的重要因素。基于此,本文以岩溶石山找水工作为研究对象,首先分析了岩溶石山找水工作的难点,然后分析了现阶段综合物探电法在岩溶石山找水中的研究现状,最后通过实例分析综合物探电法应用的可行性,希望对我国岩溶石山找水问题的解决有所帮助。  关键词:岩溶石山;找水;综合物探电法;研究
改革开放以来,高校“弱势学生群体”的出现,给学校的正常教育教学工作带来了影响,同时也给教育工作者提出了一个新的课题。随着改革的不断深入,高校”弱势学生群体”的数量正在逐
本文在明确反竞争情报研究框架的基础上,引入基于控制论思想的反竞争情报的策略,并将解决实际问题的相关方法引入企业反不正当竞争工作中,使得企业反竞争情报的研究内容更加丰富
[目的/意义]立足于当前地方历史文献的现实基础,对文献的整理、分类和研究等工作展开探索性实践,从而设计出促进地方历史文献数字化发展的具体路径.[方法/过程]分析当前地方
曾三是新中国档案事业的领导者和开拓者,他的档案学思想理论为我国档案事业的建设与发展起着重要的指引作用,也正是在档案工作的实践中曾三不断研究与总结出档案及档案工作的
[目的 /意义]对科学共同体中权威学者的地位与作用开展研究,以合著网络结构分析为视角,将网络分析与高h指数学者的作用研究相结合,从作者节点所处的网络结构与位置中探寻学者
知识经济时代,网络技术的应用和知识管理的兴起对图书馆工作提出了新的挑战,知识服务成为世纪图书馆界的研究热点。但是,无论在理论层面而还是实践层面,目前高校图书馆知识导航尚
本文将信息融合理论与元搜索引擎的研究相结合,在相关理论的基础上,对提问融合方法做一些探讨和研究。本文介绍了信息融合基本含义、原理、层次结构以及技术、方法,总结了查询扩
学位
[目的 /意义]虚拟社区信息运动效率影响因素众多,哪些因素的作用较大是信息用户及虚拟社区管理者重点关注的问题。为提高虚拟社区信息运动效率,需要识别关键影响因素,从而提
[目的 /意义]针对传统和新兴信息资源组织方法在Web2.0环境下的协作与融合问题,选择专家分类法、大众分类法和本体作为代表探寻三者的融合架构和演进策略。[方法 /过程]首先