人物言论抽取与跟踪技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ennnd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对互联网信息量的不断扩张,用户迫切地需要自动化的信息获取工具来帮助在海量的信息源中迅速找到和获得真正所需的信息。本文围绕人物言论的抽取与跟踪这一课题展开研究,探讨如何根据用户所感兴趣的某一话题,或者和用户所感兴趣的某一人物言论相关的话题,跟踪到一系列人(人物,团体或机构)所发表的关于此话题的言论,并对其进行识别和抽取。本文从言论的自动识别与抽取,和相关言论的话题跟踪两个关键环节进行深入研究。本文将新闻报道中每次出现的人物言论,看作是一个特殊的事件类型,即言论事件。对于言论事件的识别问题,本研究建立了一个规模适当的针对言论事件的语料库资源,采用机器学习的方法对候选言论进行判别。本文从上下文信息、事件核心元素以及元素间依赖等几个方面给出描述言论事件的特征。并通过对比实验的结果,分析了训练语料的规模和特征的选择对基于最大熵模型的分类方法性能的显著影响。最后,本文采用半自动构建的优化的触发词集,当训练语料的规模达到350篇新闻报道,总计716个正例,160个反例时,系统的F值得到了87.8%的最好结果。在跟踪设计中本文采用了基于查询向量的跟踪设计,分析了不同的相似度计算方法和相应的阈值调整对于系统的漏报率、误报率以及整体归一化开销的影响。并通过对比实验分析,在使用Weighted Sum相似度计算方法的情况下,采用最优的查询扩展策略并进行阈值调整,系统归一化开销得到了0.3908的最好结果。
其他文献
以水稻(Oryza sativaL.)品种Azucena(铁耐性)和IR64(铁敏感)为材料,研究了Fe2+毒胁迫下附着于根尖边缘细胞(即原位边缘细胞)的数目、存活率,根尖细胞形态结构、根尖保护酶活
目的 探讨银屑病中医分期分型治疗效果。方法 选取2015年8月~2017年1月收治的100例银屑病患者。这些患者中共包括五种发病类型,分别是:湿热型、血热型、脓毒型、火毒型以及血
分析了目前保健植物在疗养度假区中的应用现状及问题,从保健植物的应用类型的几个角度——嗅觉、听觉、视觉、触觉、味觉,初步探讨了在疗养度假区中保健植物的选择和配置,以
通过水利工程施工现场发生的安全事故、事故发生原因,以及目前安全生产管理存在问题,进行分析探讨,提出防治安全生产事故发生的措施,以期降低水利工程施工安全事故率,提高生
目前,清洁能源液化天然气(LNG)市场短缺给煤化工企业提供了重要的发展机遇。煤气化工艺的合成气中富含甲烷,若深冷分离提取甲醇合成气中的甲烷,并液化生产LNG作为清洁能源,则
20世纪90年代以来,国内外的众多经济组织为了适应日趋激烈的市场竞争,在现代信息通讯技术的支持下开始采用虚拟团队(VirtualTeam)这一新兴的组织形式。国内外研究者认为领导
2011年12月7日,巴斯夫公司宣布将在肯尼亚的首都内罗毕开设一个新的办事处,新办事处将主要服务于非洲东部和撒哈拉南部的客户。
配电网在线监控系统是利用现代电子技术、通信技术、计算机及网络技术,将配电网实时信息、离线信息、用户信息、电网结构参数、地理信息进行集成,构成完整的自动化管理系统,
田军彪教授从肝论治眩晕,认为眩晕发作主要由肝疏泄失常,气机逆乱,肝藏血乏源,脑窍失养所致。又与脾、肺、心、肾四脏关系密切,其中肝疏泄太过,气机逆乱,出现肝火犯肺、肝火
“气上冲胸”是患者自觉有气从小腹上冲至心胸、咽喉的异常感觉。此证候散见于《伤寒论》《金匮要略》各章节之中,病因病机多有差异。“医门八法”为清代医家程钟龄所创,包含