用户短文本无关语自动识别方法研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户：cainubaijiazi

【摘要】

：

在用户短文本中,意思相同的句子有多种表述方式,这些句子中存在很多与句意无关的信息,称为无关语。针对一般方法无关语识别准确度不高的问题,论文提出了一种通过二阶隐马尔科

【作者】

：

陈国刘亮亮张再跃

【机构】

：

江苏科技大学计算机科学与工程学院,上海对外经贸大学统计与信息学院

【出处】

：

计算机与数字工程

【发表日期】

：

2019年7期

【关键词】

：

短文本无关语隐马尔科夫模型机器学习 short textirrelevant wordsHMMmachine learning

【基金项目】

：

国家自然科学基金项目(编号:61371114,611170165),江苏高校高技术船舶协同创新中心/江苏科技大学海洋装备研究院项目(编号:1174871701-9)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在用户短文本中,意思相同的句子有多种表述方式,这些句子中存在很多与句意无关的信息,称为无关语。针对一般方法无关语识别准确度不高的问题,论文提出了一种通过二阶隐马尔科夫模型来自动识别用户短文本中无关语的方法。本方法在建模过程中将词本身、词性以及词的相对位置作为特征来对隐马尔科夫模型进行扩充。实验结果表明,论文给出的用户短文本无关语识别方法可以避免对训练文本进行手工编写规则的限制,且在准确率和召回率方面均有一定程度的提高。

其他文献

4#窑前鼓风机的振动与发热问题分析与处理

对鼓风机的检修装配调试进行了分析 ,找出了造成振动与发热的原因 ,并进行了处理。

期刊

振动轴承箱鼓风机

基于HBase的海量冠字号码多维索引研究

传统的关系型数据库在处理海量冠字号码数据时面临巨大挑战,系统扩展成本高,难度大。为此,论文采用HBase技术来解决海量冠字号码的存储与查询问题。HBase是云计算平台中一种

期刊

冠字号码HBASE空间曲线多维索引crown numberHBasespatial curvemulti-dimensional index

道路交通荧光标线材料研究及应用

研究了一种新研发出的路用标线材料,将荧光材料、反应型高分子材料在一定相容剂作用下进行分散融合,研究开发出发光强度高,辨识度高,视觉导向能力强的荧光标线材料。该材料白

期刊

交通安全自发光材料荧光标线路用性能traffic safetyself-luminescent materialsfluorescent marking

电容法粉尘浓度测量研究及有限元仿真

针对电容法测量粉尘浓度的问题,分析了其测量原理,用有限元方法对平行板电容器测量的原理进行分析,使用ANSYS软件对电容传感器测量粉尘浓度进行二维及三维仿真,并通过ANSYS分

期刊

粉尘测量电容传感器有限元方法仿真dust measurement capacitance sensor finite element method si

花木种子秋季采集抓好四点

绝大多数花木种子在秋季成熟。如何采集优质的花木种子，这是关系到来年花木育苗的关键，需要抓好以下几个技术环节：

期刊

花木种子采集秋季

基于文档相似度的双语文档排序学习

论文提出了一种双语文档排序学习模型.排序是信息检索系统中重要的一个环节,学者们已经对单语言环境下的文档排序学习问题进行了很多的研究,但是多语言语境下的文档排序问题

期刊

排序学习信息检索文档相似度查询翻译双语语境learning to rankinformation retrievaldocument similari

基于EMI硬化放大器的脑电信号采集系统

针对非屏蔽环境下的脑电信号采集,基于精密仪表放大器及EMI硬化放大器设计了前端调理电路,包括前置放大级、右腿驱动电路、陷波放大级以及低通放大级,实现了EEG可视化放大的

期刊

脑电信号信号采集Sigma-delta ADCEMI hardenedLabVIEW

手性蜂窝夹芯概念发动机罩行人头部保护性能仿真

为了减小汽车事故中的行人头部损伤,提出了一种具有四韧带手性蜂窝芯体的夹芯吸能式发动机罩概念设计.建立了头型冲击器、四韧带手性蜂窝以及传统六边形蜂窝夹芯的吸能式发动

期刊

汽车安全行人保护手性蜂窝发动机罩负泊松比automobile safetypedestrian protectionchiral honeycombe

基于多层LMDI分解法的云南电力消费增长趋势研究

在传统单层对数平均迪氏指数法(Logarithmic Mean Divisia Index,LMDI)的基础上,为解决单层模型在特定政策、行业方面解释性不足的局限性,提出利用多层LMDI分解模型,将云南省

期刊

电力消费指数分解法影响因素Electricity ConsumptionIndex DecompositionIn uencing Factors

基于UML的视频点播系统的设计要点分析

为了加快在线视频点播系统的信息化步伐,提高在线视频点播水平,建设和完善在线视频点播系统已经变得十分重要。论文旨在通过设计在线视频点播教育平台,借助UML（统一建模语言）语

期刊

视频点播教育平台B/SUMLCODEIGNITERvideo on demand education platform B/S UML Codeigni

用户短文本无关语自动识别方法研究

与本文相关的学术论文