面向学科的主题词库构建及其应用研究

被引量 : 0次 | 上传用户:hasfyturnip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题词库就是经过规范化处理了的主题词及其之间的关系所构成的词典。主题词库包括两个部分:词库和关系库,词库用于存储主题词,关系库则用于存储主题词间的各种关系。主题词库是信息组织与检索的重要工具,其应用非常广泛:它可以解决方便、快速、科学的检索大量文献的问题;特定学科领域的主题词库可以用于构建针对具体学科领域的垂直搜索引擎;主题词库中描述的主题词之间的语义关系可以起到知识导航的作用;此外,主题词库也被应用到人工智能、云计算等相关领域中。目前国内关于主题词库的研究也取得了一些成果,但是随着研究工作的深入,主题词库构建过程中出现了一些新的问题:现有的主题词库大都采用人工标注完成,费时费力;而且目前面向具体学科领域的主题词库构建的相关研究也很少;此外,现有主题词库中主题词之间的关系都是两两主题词间的直接关系,并没有挖掘主题词之间间接的隐性关系。因此,研究面向具体学科领域的主题词库构建工作意义重大。本论文的主要工作是以教育技术学为例,构建面向特定学科领域的主题词库。论文的主要研究工作有:(1)介绍了国内外关于主题词库的研究现状以及与主题词相关的理论基础。(2)改进并实现了主题词抽取的相关算法,提出了一种文档结构与统计相结合的主题词提取方法,并通过实验证明此方法在准确率、召回率等方面要优于传统的TFIDF方法。(3)研究ISM算法将其运用在主题词隐性关系的挖掘上,实现了利用ISM算法挖掘主题词间隐性关系、形成主题词的层级关系图。(4)利用主题词的抽取算法和隐性关系挖掘算法以教育技术学为例构建面向特定学科领域的主题词库并对其做了应用研究。论文的特色之处在于改进了主题词抽取的相关算法,并且在主题词及其简单关系的基础上实现了主题词间隐性关系挖掘,形成主题词的层级关系图,这是以往任何主题词库构建工作都没有研究过的。最后,通过主题词及其关系挖掘算法构建了面向教育技术学的主题词库并对其做了应用研究。
其他文献
明确了自动转换开关(ATSE)的安装位置,当PC级ATSE安装在电源级时,尤其重点考虑短路性能参数与预期短路电流,还应仔细分析ATSE的短路性能参数与其上级保护电器配合关系,提出了
目的 探讨无水酒精瘤内注射在肝癌切除手术中应用的临床价值。方法 对 2 7例肝癌患者在手术中行无水酒精瘤内注射 ,并分析其疗效及预后。结果  8例单发局灶性≤ 5cm的小肝
有机小分子催化剂和水溶液中的有机化学反应都是当今有机化学研究的前沿领域。前者通过有机化合物催化有机化学反应,不仅有较高的立体选择性,而且与金属催化剂相比,环境友好,反应
以光栅外腔半导体激光器 (ECDL)作为光源 ,获得了铯原子D2 线B线 (6 2 S1/ 2 F =4→ 6 2 P3 / 2 F′ =3,4,5 )的调制转移光谱 (MTS)。与传统的饱和吸收光谱作了比较 ,并对不
政府公信力问题实质上是一个民心所向的问题,政府公信力是整个社会诚信最重要的组成部分,社会诚信的发展是基于公众对政府的信任来发展。公众是否信任政府影响着公共政策执行
当前世界上主要港口城市都纷纷依托港口优势,努力发展以临港型产业为主的经济集群,临港产业如火如荼地进行着。泉州市地处我国东南沿海,邻近港澳,与宝岛台湾隔海相望,是中国
学风问题作为学校建设和发展的重要环节,起着引导、规范、激励师生的作用,它不仅是学校自身办学思想、教育质量、管理水平和综合实力的重要标志,也反应了学生的思想品质、学
步入21世纪以来,随着我国与发达国家经济差距的日渐缩小,人们的消费水平和理念都发生了很大的改变。由于人们健康意识和体育消费需求增加,使得大量的资金流向了体育健身市场
伴随着当代大众消费水平的日益提高,图书出版业的不断繁荣,现代传媒技术的大力发展,文学在这种文化语境中不断凸显出商业原则。这使得文学从内容的呈现方式到生产与传播都发
工作流模型是构建工作流管理系统的基础,也是构建企业信息系统的关键。基于构件的软件复用是解决软件复用问题的关键技术,这种技术在软件开发过程中具有重要作用。因此,为了