用户短文本无关语自动识别方法研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:cainubaijiazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在用户短文本中,意思相同的句子有多种表述方式,这些句子中存在很多与句意无关的信息,称为无关语。针对一般方法无关语识别准确度不高的问题,论文提出了一种通过二阶隐马尔科夫模型来自动识别用户短文本中无关语的方法。本方法在建模过程中将词本身、词性以及词的相对位置作为特征来对隐马尔科夫模型进行扩充。实验结果表明,论文给出的用户短文本无关语识别方法可以避免对训练文本进行手工编写规则的限制,且在准确率和召回率方面均有一定程度的提高。
其他文献
对鼓风机的检修装配调试进行了分析 ,找出了造成振动与发热的原因 ,并进行了处理。
传统的关系型数据库在处理海量冠字号码数据时面临巨大挑战,系统扩展成本高,难度大。为此,论文采用HBase技术来解决海量冠字号码的存储与查询问题。HBase是云计算平台中一种
研究了一种新研发出的路用标线材料,将荧光材料、反应型高分子材料在一定相容剂作用下进行分散融合,研究开发出发光强度高,辨识度高,视觉导向能力强的荧光标线材料。该材料白
针对电容法测量粉尘浓度的问题,分析了其测量原理,用有限元方法对平行板电容器测量的原理进行分析,使用ANSYS软件对电容传感器测量粉尘浓度进行二维及三维仿真,并通过ANSYS分
绝大多数花木种子在秋季成熟。如何采集优质的花木种子,这是关系到来年花木育苗的关键,需要抓好以下几个技术环节:
论文提出了一种双语文档排序学习模型.排序是信息检索系统中重要的一个环节,学者们已经对单语言环境下的文档排序学习问题进行了很多的研究,但是多语言语境下的文档排序问题
针对非屏蔽环境下的脑电信号采集,基于精密仪表放大器及EMI硬化放大器设计了前端调理电路,包括前置放大级、右腿驱动电路、陷波放大级以及低通放大级,实现了EEG可视化放大的
为了减小汽车事故中的行人头部损伤,提出了一种具有四韧带手性蜂窝芯体的夹芯吸能式发动机罩概念设计.建立了头型冲击器、四韧带手性蜂窝以及传统六边形蜂窝夹芯的吸能式发动
在传统单层对数平均迪氏指数法(Logarithmic Mean Divisia Index,LMDI)的基础上,为解决单层模型在特定政策、行业方面解释性不足的局限性,提出利用多层LMDI分解模型,将云南省
为了加快在线视频点播系统的信息化步伐,提高在线视频点播水平,建设和完善在线视频点播系统已经变得十分重要。论文旨在通过设计在线视频点播教育平台,借助UML(统一建模语言)语