高校教师社会网络的自动构建技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mao_320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网页信息内容出现了爆炸性的增长。这虽然使得人们从互联网上获取想要的信息变得可能,但是如何从海量信息中快速发现这部分有用内容却是亟待解决的问题。另一方面,社交网络的兴起有效地推动了人与人之间的交流,并在一定程度上改变了人们获取信息的方式。本课题旨在利用机器学习、数据挖掘等自然语言处理相关技术,以高校教师为研究对象,自动化的构建一个高校教师社会网络,不仅向广大互联网用户提供教师个人信息、研究信息等内容,实现一个更直接、高集成、全方位、多角度的信息展示平台,而且在此基础上打造一个大量科研人员参与的学术交流平台。本文重点研究了以下问题:首先,本文实现了一种基于块划分的教师个人信息抽取模型。教师个人信息是指姓名、学校、职称等,是教师信息的基本组成部分。本文对于互联网上的教师介绍页面,首先进行预处理,然后将其划分成不连续的信息块,利用条件随机域模型对块中的信息项进行标注。词级别特征对于基本信息和联系信息的抽取已经有了较好的结果。通过将特征从词级别扩充到块级别,能够有效解决教育相关信息项存在的长距离依赖的问题。其次,论文发表情况最能反映教师研究信息,本文设计了相应的框架获取教师论文信息。获取到的教师论文中存在教师姓名非完全匹配、重名等引入的错误,姓名非完全匹配利用规则方法可以去除,本文重点研究了论文作者重名消歧问题,提出了一种基于层次聚类的消歧策略。在聚类过程中使用论文的基本信息作为特征,并分别使用了基于先验知识和基于相似度阈值的两种聚类终止条件。最后,基于教师基本信息和研究信息,本文研究了高校教师社会网络的构建和社区发现。教师之间有多种关系,这里主要依据相同研究方向进行网络构建,并使用了两种方法。一是利用主题模型发现教师所有论文的主题分布特征,以此计算每两个教师之间的关系构建出社会网络,然后利用马尔科夫聚类模型进行社区发现。另一种方法是利用教师论文关键词集合建立教师之间的联系,针对该网络使用了两种复杂网络聚类算法进行社区发现,并从社区发现质量和时间效率上对这两种方法进行了分析。
其他文献
根据国家信息产业部对振兴软件业和推动社会服务信息化的具体要求,以及政府、企事业单位对WEB个性化信息采集与管理的需求,Web信息服务行业已成为目前最热门的行业之一。然而面
伴随着信息化时代的到来,万维网(WWW)已经成为人们日常生活中非常重要的信息源。但是随着网络信息覆盖面逐渐扩大,增长速度不断加快,人们对获取信息的快捷性要求也越来越高。
随着信息技术的高速发展,网络中的数据共享和交换行为出现得越来越频繁。因为数据挖掘是从原始数据中挖掘提取对人们有用的信息,因此它也被作为数据分析工具而得到了广泛应用
自主导航技术是移动机器人的关键技术,也是移动机器人智能化程度的重要体现,而机器人同时定位与地图创建(Simultaneous Localization and Mapping, SLAM)是实现真正自主导航
目前,网络规模迅速扩张,网络的高速发展给数据传输带来了诸多的安全隐患,接连不断的信息泄密和网络犯罪使得网络安全问题更加突出。在信息化时代,数据是承载信息的基础,信息
随着网络技术的飞速发展,物联网(Internetof Things,IoT)受到人们的广泛关注。低速物联网(Low Speed InternetofThings,LSIoT)中的节点具有低速率、通信范围小等特点,因此在降低
基于GPS车辆导航设备的应用研究越来越广泛,嵌入式Linux系统具有广泛的应用范围,是近年嵌入式发展最快的方向之一。将GPS、嵌入式技术、GIS地理信息系统融合实现电子地图实时
网上购物的兴起,使人们享受到了前所未有的便利。不过,随着电子商务网站数量和规模的不断扩大,顾客需要越来越多的时间去寻找自己想要购买的商品。一方面,用户面对大量的信息
运动目标检测与目标跟踪技术作为计算机视觉研究领域的重要技术之一,融合了计算机、人工智能、模式识别、图像处理以及自动控制等多个领域的先进技术,在视频监控、图像压缩、
随着因特网的爆炸性增长,网络上的教学资源越来越丰富,而迅速发展的信息化教育,也使得教学资源库的建设越来越受到人们重视。一个内容丰富且结构良好的教学资源库不仅可以有