面向网络评论的用户观点核心信息自动抽取技术

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:dy911615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线购物已经成为日常生活中一种基本的消费模式。在此环境下,网络评论由于包含已有用户对现有商品所持的观点,因而能够为其他潜在的客户在确定购买决策时提供重要的参考价值。另一方面,商品或是服务的提供方也能根据用户的评论了解消费者对自身产品的反映,从而能够有针对性地提高商品或是服务的质量。然而,网络评论的数量巨大,这就决定了需要采用自动化和智能化的技术来应对海量评论的处理。  用户评论包含了两个核心对象——观点目标和观点词。前者指定了用户对什么对象进行评论,后者描述了作者对该对象持有的观点是什么。因此,从评论中自动抽取观点目标和观点词是观点挖掘的一项重要工作。本文针对观点目标和观点词的协同抽取方面展开研究,主要工作包括:  首先,有监督的观点目标和观点词抽取方法。本文首先采用字对齐模型从评论中构造出候选的观点词对,即<观点目标,观点词>二元组,然后通过特征工程将候选的观点词对进行向量化,进而采用有监督的方法实现观点目标和观点词的联合抽取。  其次,结合主动学习的半监督抽取方法。在有监督学习方法中需要大量的人工标签实验数据,但人工标签数据是耗时费力且易出错的。因此本文提出一种结合主动学习的半监督方法协同抽取观点目标和观点词。该方法首先采用基于样本的不确定采样策略和基于向量特征的不确定采样策略评估标注样本能为抽取性能带来的信息量,然后选择信息含量大的进行标注,通过多次迭代逐步提升抽取模型的泛化能力。  最后,面向观点目标和观点词联合抽取的数据集。本文在Amazon评论集的基础上构建了一个针对观点目标和观点词联合抽取的真实数据集。该数据集涵盖了Amazon上的五种商品的评论,近60万的候选观点对。本文中提出的算法和现有方法的对比实验均在该构造的数据集上进行,验证了所提出算法的有效性。
其他文献
伴随科技的显著进步和社会的高速发展,今天的网络已经融入我们生活的各个方面。这些复杂网络系统在给我们生活带来便利的同时,也为我们评估和保障网络服务质量带来了诸多困难。
钢铁企业的生产过程并含着连续和断续的特征,是一个典型的混杂系统。在实际生产中,制定一个合理的生产调度计划来协调好生产过程中的物料、设备、检修时间、交货期等各个因素直
随着科技水平的不断进步,一项新的研究领域——信息物理系统,越来越受到专家和学者的关注,科学家预测它的出现将会改变了人与自然交互的方式,从而帮助人类更好的认识了解物理
专利文档中包含产品的组成结构、设计原理、组件功能等相关内容,蕴含了丰富的创新性技术信息,是领域内创新性和实用性的解决方案,被看作是产品创新设计的重要知识来源。功能的创新是产品创新的基础,从专利中获取其功能信息成为研究的热点。然而由于自然语言对知识表述的随意性,给这项研究带来一定的难度和挑战性。本文经过大量的专利文献的阅读,分析了专利文档的组成结构和知识分布,确定了专利摘要文本为功能信息抽取对象,通
随着Web2.0时代的到来,出现了各式各样的社交网络应用来满足用户日益丰富的社交活动需求,信息借助这些应用平台高速流动,加之各种智能移动终端技术的不断进步,越来越多的用户在推
如今机器人在静态环境下的路径规划问题已经有了很成熟的研究成果,并且可以高效地解决任何静态环境下的机器人寻路问题。然而,动态环境下机器人的路径规划问题仍然是一个具有挑
三维重建技术是目前视觉研究的热点之一,它是对三维物体或者场景图像描述的一个逆过程。即从若干幅的图像序列中计算出物体场景的三维深度信息,然后再通过二维的图像恢复出来三
气象数据的可视化分析可以帮助气象科学家研究气候变化,预测天气变化。对于普通用户,直观的天气信息可视化可以帮助他们了解天气状况,做出有效的决策。现有软件气象可视化软
随着互联网技术、传感器技术、嵌入式技术、通信技术的快速发展,物联网越来越受到工业界和学术界的关注,数字家居、智慧楼宇、精准农业、智能交通、数字医疗等项目也被广泛提
油脂是人体不可或缺的营养要素,其色泽是油脂质检中比较重要的一项指标,油脂色泽的检测对提高油脂质量起着举足轻重的作用。近年来,对油脂颜色测量的方法有很多,包括目视法、分光光度法、光电积分法等,但是基于自动化和检测成本来考虑,设计一款能够实现自动化、测量准确、价格低廉的油脂颜色测量仪是非常有必要的。本课题首先针对罗维朋目视比色计操作繁琐、劳动强度大,存在人为误差,进口比色计价格昂贵等问题,提出课题需要