基于领域情感分析的潜在客户识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:taohongguanghao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在客户指能为企业在未来发展阶段带来盈利的一类群体,准确识别潜在客户可为企业精准营销,扩大产品市场占有率,提高核心竞争力等带来多方面帮助,是一项重要的研究内容。社交媒体环境下的用户生成内容,蕴含着丰富的情感信息,其中包括对于产品需求、品牌感知、购买意愿等内容的情感态度,研究表明用户的情感与购买意愿具有相关性,情感信息有助于企业发现潜在客户。但是,目前情感分析的主要工具情感词典无法很好的适应领域依赖性,无法及时覆盖社交媒体中的网络新词和准确识别未登录候选词的情感倾向,因此需要研究领域情感词典的构建方法。同时在识别潜在客户的过程中,由于用户生成内容文本不规范、情感随主题不断变化,且存在目标潜在客户群体所占比例偏低等数据不平衡问题,这些为潜在客户的识别带来困难。论文聚焦社交媒体下的汽车领域,构建了汽车领域的情感词典用于文本情感分析,同时将情感词典应用于不平衡数据集下的潜在客户识别任务中,设计联合领域情感主题的潜在客户识别方法,以发现具有潜在购车意向的用户。本文首先梳理了文本情感分析和潜在客户识别的研究现状,对情感词典的构建流程和文本分析中的特征选择、特征筛选和常用分类算法进行了介绍。其次,围绕情感分析最常用的工具情感词典,研究了情感词的情感极性判别规则。针对目前在构建情感词典的过程中使用单一识别算法存在的缺点,设计了一种改进的集成规则,提出了一种社交媒体环境下领域情感词典自动构建方法。接着,本文分析了用户生成内容中存在的情感主题信息,并将领域情感词典加入到联合情感主题模型中作为后验信息提取出情感主题特征,在此基础上进行潜在客户识别的特征工程研究并构造特征集合。另外,针对实际数据中存在的类别不平衡情况,设计了一种样本重抽样方法和一种针对不平衡数据的多样集成框架共同作用于数据倾斜下的潜在客户识别任务。最后,使用真实的社交媒体文本语料进行实验研究,验证本文所提方法。对比实验表明,本文提出的领域情感词典构建方法和联合领域情感主题的潜在客户识别方法在不同的对照组实验中均显示出良好的表现。本文在理论上对领域情感词典的构建、不平衡分类等内容进行了深入的研究,在实践中对企业发现潜在客户提供了解决方法,具有一定的理论意义和实践价值。
其他文献
高校食堂作为后勤中重要的组成部分,其食品和服务质量与学生的学习、生活息息相关。本文通过对在校学生对餐厅的满意度进行调查,发现其在经营管理中出现的问题,针对存在的普
孙中山早年主张法治 ,晚年倾向于党治。 1 92 8年 ,国民党统一全国 ,宣布训政开始 ,由此产生党治和法治之争。蒋介石受中原大战刺激 ,接受胡适等人权派的要求 ,主张制定约法
依据美国环境法律和总统行政命令,行政机构制定重大环境法规时应当进行成本效益评估,评估内容主要包括法规草案必要性的陈述、可替代方案审查、成本和效益的测量(包括可替代方案
本文针对大唐长春第三热电厂汽轮机在生产过程中,通过循环水排出大量低温余热的实际情况,采用热泵技术回收部分热量,实现冬季供暖。本文主要阐述了电厂循环水余热回收用热泵
大语文教学,把学生阅读提到一个相当的高度,而学生语文能力与水平的体现,关键就在阅读和写作了。因此,现代文阅读教学在语文教学中有着举足轻重的作用。多年的教学实践证明,
<正> 乳糜尿属于祖国医学“膏淋”与“尿浊”的范畴。《诸病源候论》云:“诸淋者,由肾虚而膀胱热故也。”指出肾虚为本,膀胱湿热为标的病理分析,为后世医家所宗旨。张景岳又
LTFT(低温费-托合成)过程有超过40%的蜡生成,F-T合成蜡主要成分为直链烷烃。虽然F-T合成蜡具有很高的十六烷值,但是其低温流动性较差,不能直接用于燃料油。将F-T合成蜡轻度加
邢台市是一个传统的历史文化古城,其文化产业的发展较周边地市还很落后,而文化产业作为朝阳产业,已经成为未来城市发展的新的经济增长点。本文立足邢台市文化产业现状,剖析了
本研究以Alcalase 2.4L酶解"双低"油菜籽宁杂19号得到的菜籽蛋白酶解物(rapeseed protein hydrolysate,RPH)为原料。通过超滤和凝胶色谱分离其活性肽组分,对酶解液及各分离组
对汽车涂装车间中的VOC排放量进行逐工位分析,同时将溶剂型和水性涂料的VOC排放量进行对比,说明使用水性喷涂工艺能够大大减少VOC的排放。同时,对涂装线体VOC排放减少提出建