基于时间序列聚类算法的叙词表新术语遴选研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:algenesis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]为保证叙词表术语收录的完整性,需要及时将领域出现但未收录的新术语补充收录到叙词表中,结合候选词的时间及文档词频特征,从时间序列角度探索新术语的分布情况以指导新术语遴选是值得研究的问题.[方法/过程]文章主要对词汇文档词频对应的时间序列进行研究,将时间序列进行词频归一化及时间等长预处理,引入k-means聚类算法,对候选词汇进行基于时间序列趋势变化的聚类,探索术语以及非术语趋势变化的规律,进而总结新术语应该满足的趋势变化特征.[结果/结论]通过聚类研究,总结得出新术语普遍处于增长趋势.实证将处于增长状态的候选词汇遴选出来,经过专家判断,该方法可以有效从候选词汇中遴选出其中能补充到叙词表中的新术语,该方法有比较高的准确率.[创新/局限]创新之处表现为叙词表新术语的遴选中同时考虑了时间变化和文档词频因素,局限于数据处理规模,实证中只统计了论文关键词的词频数据.
其他文献
在诊室里,一位泌尿道感染反复发作的小孩子,诉说尿急、尿痛,有时还伴有发热、寒战、腰痛等症状。经检查发现患者尿道口、阴道口周围粘膜充血、水肿,阴道口还有脓性分泌物。
侯力平,1959年生于黑龙江省绥棱县。在职研究生,工艺美术师,绥棱陶文化科学研究所所长,研究陶制作工艺、设计、陶土的应用等,成果较突出。是绥棱陶文化研究最具艺术实力的代
期刊
[目的/意义]为了对学科交叉宏观态势进一步把握,基于ESI已有的学科分类,提出一种简单有效的测度方法.[方法/过程]借鉴相关研究,本文以ESI高被引论文为研究对象,以学科论文标
[目的/意义]研究学术会议论文新颖性测度方法,为会议论文的新颖性评价提供新的视角.[方法/过程]本文设计吸收新颖性指标和产出新颖性指标测度方法,选择“人工智能”领域的会
摘要:小组合作学习模式是是课程改革的一个重要切入点,尤其是在当今高中历史教学中,对于改变传统的灌输式教学,远离枯燥乏味的课堂,都有着不可估量的作用。本文对小组合作学习在高中历史教学中的有效开展进行了探讨。  关键词:小组合作学习;高中;历史教学;策略  在高中历史教学中有效运用合作探究的教学模式,能使课堂氛围活跃起来,使学生在探究过程中能积极发表自己的看法和见解。在他们的积极发言中,使思维互相发生
常常有这样的情况,当你去电影院看电影时,如果看的人不多,且有大量的空座位时,你肯定不会紧挨着一个陌生的坐下,这是因为我们每个人都需要一定的个人空间的缘故。在现代都市
[目的/意义]图书馆数据治理成熟度评价旨在衡量图书馆数据治理能力强弱程度,对促进图书馆数据治理实施进程和改善图书馆数据治理中存在缺陷有着指导性作用.[方法/过程]本文通
  An optical sensor system composed of a gas-testing chamber and a liquid-sample chamber and an automatic sampling unit was prepared for rapid field detection
会议
[目的/意义]探究用户信息行为对谣言传播的影响可以为辟谣工作提供新的思路,但目前现有研究大多基于传染病模型研究用户信息行为的影响,而基于博弈模型所考虑的用户信息行为