面向多文档摘要的主题建模方法研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:penghong97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多文档摘要技术为人们快速、有效的组织大量信息提供了一种良好的途径。主题模型方法是目前多文档摘要的主流算法,但是,国内外学者研究多文档摘要主要采用基于平面结构的主题模型。多文档摘要对结果全面性,覆盖、差异性,概括与细节等要求使得层次主题模型特别适合应用在摘要主题建模任务中。布雷等人提出了层次潜在狄利克雷分配模型,其良好的效果已得到了广泛的验证。但应用建模时,多而复杂的先验超参设置,随机算法本身的不确定性以及不同的语料特征使得我们很难找一个快速、有效的方法对新数据进行建模。本文提出了由贝叶斯线索和范围线索构成的统一建模分析框架。采用理论分析与实验验证相结合的方式来剖析hLDA层次建模中的关键影响因素。着重从层次树的路径选择,主题层次选择以及不同层次词的选择等方面分析模型本身特点以及应用到多文档摘要时的特征选择。然后给出一个切实有效的经验化建模策略和流程,最后结合JACM和MultiLing2013多文档摘要语料等进行建模效果评估。
其他文献
公平如同一把尺子,它能提供国家社会建设所需要的各种标准与尺度。本文以社会公平的视角,从高尔夫运动参与者为切入点进行研究就是力求在国家体育领域中的社会体育小领域里可
党的十九届四中全会提出,健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。这是党中央首次提出将数据作为生产要素参与收益分配,反映了当前以数据为关键要素的数字经济浪潮在全球范围内迅猛推进,数据资源在重塑国家技术产业竞争力、塑造未来国际竞争新优势中的基础性、战略性作用日益凸显。以欧盟和美国为代表的主要国家和地区在加快数据资源开发利用的同时,数据安全保护立法与实
汶川地震中发生了太多的感人故事。在无数次泪水洒落后,当这则故事映入眼帘时,人们还是禁不住为母爱惊人的表达方式而再次流下动情的热泪。    When rescuers found her,she was already dead,crushed by the collapsed house.Through gaps in the rubbles,they could see her posture.
期刊
目的分析我院门诊小儿头皮静脉穿刺现状,探究提升穿刺成功率的有效护理措施。方法选择我院2016年3月至2017年3月收治的56例门诊小儿头皮静脉穿刺患儿,所有护理人员经综合技能
本文运用文献资料法、内容分析法、历史分析法从国家形象的视角出发,对于1949年-1991年《人民日报》苏联体育报道进行分析研究。本文以1949年以后,中苏外交发展史为基础,结合
<正>不久前在京举行"2007国际医院交流与合作论坛"透露,医疗不良事件频发,导致患者安全遭受挑战,已成为世界性的问题,各国为医疗不良事件所
在刚刚结束的2019年,我国人工智能的发展不论是平台建设,还是新机制、新路径的探索,都有不少进展。近日,2020年全国工业和信息化工作会议提出,加快制造业数字化网络化智能化
为切实减轻疫情防控期间医疗机构的工作压力,成都市大邑县医疗保障局打通"1+4"医疗服务绿色通道,为大邑县人民医院、望县中医院及时办理感染科病区调剂床位备案,线上受理大邑
背景:"手风琴"技术治疗骨折不愈合在临床少量应用后效果显著,但还需要进一步的基础研究作为支持。目的:验证"手风琴"技术可治疗新西兰大白兔骨不愈合。方法:建立新西兰大白兔