基于LDA模型和AP聚类的主题事件抽取技术

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:yvonnechan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,事件抽取技术一般是对文本的事件信息进行直接抽取,忽略了文本的信息结构,并且抽取结果易受文本词语分布的影响。本文对文本的概念层级结构进行分析,并提出一种基于二次聚类并再划分的主题事件抽取方法。该方法可以提取文本的主题-事件层次化信息,并通过信息词的二次提取减小相关事件信息的干扰,优化抽取结果,并利用事件时间轴展示出事件的发展状态信息。实验结果表明本方法可以有效地提取文本的主题事件信息。
其他文献
21世纪以来,中国开始进入一个崭新的时代,新时代对初中生提出了更高的要求。我们要培养什么样的人?如何培养人?为谁培养人?等问题为我们今后学生的教育工作指出了方向。初中
山东外国语职业学院经济管理学院坚持“教育以产业为导向、产业以教育为依托”的办学思路,坚持将人才培养与人才技能应用有机结合,做到了“学以致用”与“用以致学”相得益彰,实
报纸
动车组作为一种高速、安全的铁路客运设备,在运营过程中难免发生故障。针对动车组故障数据量巨大、价值密度低的特点,设计一种基于DHP算法的关联规则挖掘优化算法。采用再哈希
位置K匿名是实现LBS(Location Based Services)隐私保护的重要手段。已有的K匿名机制大多针对无知识背景的攻击者模型,对攻击者能力的估计不足,存在用户位置隐私泄露的风险。针对此问题,本文提出一种基于历史轨迹预测的LBS动态匿名算法。该算法充分考虑攻击者基于历史数据对用户轨迹的预测能力,根据用户轨迹隐私泄露的风险级别,动态调整K匿名值实施保护,实验证明该算法在保护用户位置隐私方
日前,泰克元件解决方案公司宣布,推Ⅲ全球速度最快、最准确的lO位商用数,模转换器——TDAC-25。该25GS/s专用集成电路支持泰克最新AWG70000任意波形发生器的市场领先性能,且现在可
军械装备保障业务数据集成对解决保障信息孤岛问题,提高保障业务的基于信息系统作战能力具有重要意义。本文在阐述数据集成和面向服务基本概念基础上,提出面向服务的系统集成
目的探讨大龄儿童弱视综合治疗效果。方法对47例(52眼)弱视患儿进行遮盖、红闪、后像、光栅、光刷、精细目力训练等综合治疗,屈光不正患儿给予戴镜矫正、斜视患儿行斜视矫正术、
针对现有数据流相关的差分隐私发布技术主要应用于二进制数据流,不能高效地处理一般性数据流发布中隐私的问题,提出一种高效、面向分布不均匀的数值型数据流的差分隐私直方图发布算法——DDPA。该算法基于滑动窗口模型,利用相邻2个时间戳的数据集分布的相似性,动态合理分配隐私预算,使得每一个窗口的总预算不超过隐私预算ε,并利用分组与合并策略,快速计算出局部最优直方图。通过对该算法发布数据的可用性与同类算法进行
首先,分析国内外蒙皮加工技术现状。其次,针对蒙皮加工中影响蒙皮质量与制造的外形铣切工序进行分析,对现有的的模板铣切工装进行优化改进;并通过技改的实施,大量引进数字化
共享经济背景下,为供给侧改革提供了有利的环境和条件。分析共享经济与供给侧改革的关系,指出共享经济背景下城市供给侧改革存在的问题,并提出相应的供给侧改革措施,以期能为