扩展DPMM模型在短文本主题识别中的应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:mchz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,话题检测与追踪(TDT)得到广泛研究。然而,研究主要基于常规的新闻,扩展到短篇报道依然有问题。提出基于耿氏混合模型(DPMM)的话题识别方法,以统一的模型处理话题切分和TDT。介绍DPMM在话题识别中的应用以及讨论两种专门用来解决短篇报道的稀疏问题的方案。一个是算法流程,将话题识别的处理单元由单个短文本转为会话。另一个是扩展DPMM模型,当估算与已知的话题的关联词时考虑字的依赖。随后,通过同时处理话题切分和TDT来识别自发文本流的话题。DPMM模型的优势在于混合组件的数量不必提前确定,并且不
其他文献
结构式家庭治疗认为,个体的问题与家庭结构息息相关,从家庭结构和互动模式的角度分析更容易挖掘个人症状背后的深层原因,改变不当的家庭结构和互动模式有助于彻底消除家庭成员的个人症状。已有研究和实践表明结构式家庭治疗对进食障碍、校园霸凌、家庭危机等青年问题都具有相当的疗效。本文研究目标是探讨结构式家庭治疗干预青年毒品滥用的普适性、有效性以及奏效的方式。为实现研究目标,本研究以结构式家庭治疗为理论基础,设置
针对黄河下游引黄灌区水量订单随意性大、水资源利用率低的问题,本文紧密结合当前调度管理制度,基于实时灌溉预报与模糊聚类理论,提出了黄河下游灌区水资源实时分配管理模型,
目标跟踪作为人工智能领域的一个重要分支,它是对序列图像的处理过程,即在连续帧中输出指定目标的准确位置并形成运动轨迹。现在目标跟踪的应用主要集中在智能监控、无人机、自动驾驶等领域。在目标跟踪领域,从传统算法到深度学习算法的递进过程中,目标是否具有全面的特征表达会直接影响跟踪的精度和成功率。如何获得更全面的特征表示方法是本文的关键点之一。近些年来的目标跟踪算法可大致分为传统的目标跟踪算法以及深度学习相
随着通信技术的更新换代,5G移动通信网络以其高速的数据传送速率,极短的时延和可靠的稳定性,将带来一场科技革命。党中央、国务院高度重视5G通信网络的重要意义,从党的十八大
<正>我是1983年4月调入省委宣传部工作的,直至1989年6月省委决定我到省文化厅任职。尽管时光的流水冲刷去我不少的往事印记,但在省委宣传部工作过的六年多岁月,却历历在目、
2016年7月开始,爱立信与Icomera已在德国铁路公司遍布德国的386辆城际高速列车上部署移动互联网连接解决方案并为其提供相应支持。车载Wi-Fi网络可将列车与德国全部三家移动
期刊
用杂交瘤技术制备了两株分泌抗人精子单克隆抗体的细胞株,经酶联免疫吸附试验证明两株细胞株所分泌的单克隆抗体均能与人精子产生特异反应,并有明显的精子凝集和制动作用。
裘山山是一位出身军旅的作家,于1995年左右转向了日常生活的书写,并在小说创作中初步显示出了一定的叙事意识。在丰富的创作实践中,她充分调动叙事要素并将之与小说的人文主义关怀相融合。本文将从叙事学的理论着手,以裘山山小说的整体创作为研究对象,细致探讨其小说的叙事艺术,并在探讨过程中着力挖掘其叙事艺术的独特意义。全文除绪论和结语外,共分为四章。绪论主要梳理裘山山小说的研究现状,介绍本文的研究对象和方法