【摘 要】
:
文章对中文非结构化文本中(半)自动获取学科术语的相关语义关系进行了探讨,以寻找行之有效的获取方法。从CNKI获取"数字图书馆"学科领域文献,通过术语抽取、动词抽取、向量空
【机 构】
:
南京大学信息管理学院,江苏省数据工程与知识服务重点实验室
【基金项目】
:
江苏省社会科学基金一般项目“领域术语语义关系自动获取研究”(项目编号:15TQB009);国家自然科学基金青年项目“面向学术资源的TSD与TDC测度及分析研究”(项目编号:71503121)研究成果之一
论文部分内容阅读
文章对中文非结构化文本中(半)自动获取学科术语的相关语义关系进行了探讨,以寻找行之有效的获取方法。从CNKI获取"数字图书馆"学科领域文献,通过术语抽取、动词抽取、向量空间模型构建、双重关联规则分析和规则评价获得了具有较强关联的术语对以及作为关联标签的动词,从而获取了学科术语的相关语义关系。该获取方法与其他方法相比,具有较高的可行性和有效性,并对术语的相关语义关系进行了有效性和实用性的评价,提高了获取的准确率。但文章也存在一定的局限性,在对术语相关语义关系的有效性和实用性进行评价时,指标的选择和阈值的确定存在人工干预,具有一定的主观性。
其他文献
目的:评价Southern印迹分析(SBA)和聚合酶链反应(PCR)检测原发性皮肤T细胞淋巴瘤(PCTCL)T细胞受体(TCR)基因重排(GR)的意义。方法:以PCR扩增TCRγ的结合Ⅴ(可变区)-J(结合区)序列(TCRγPCR)和SBA分析TCRβ链基因(TCRβSBA)检测克隆性GR。结果:蕈样肉芽肿(MF):TCRγ
特种车辆与普通轿车内饰风格不同,特种车辆内饰改装主要注重功能性,依据使用要求进行整体规划设计,装配特种设备,实现其特有功能。
<正>含咖啡因与不含咖啡因的咖啡摄入与死亡风险的关系尚无定论。方法:研究人员纳入护士健康研究(Nurses’Health Study,NHS)中74 890名女性,NHS2中93 054名女性和卫生专业人
姓氏文化是一个民族历史文化的一部分,它可以体现出特定的历史时期,一个民族的历史环境、文化习俗、生活方式等等。本文追根溯源,探究满族传统姓氏的来源,得出满族姓氏具有历
<正> 前言汽轮发电机冷态转子按联轴器找中心,须考虑机组热状固有特性造成轴承中心变化,即所谓对轮冷态调整中心的补偿或找中心冷态预留量。一般这些数据由制造厂家提供。由
为了研究桥梁结构的三维日照温度场及其效应,基于计算机图形学理论中的光线跟踪技术和空间剖分技术,提出了三维复杂结构表面日照阴影的快速识别方法,在此基础上又基于传热学