基于Web文本挖掘的网络口碑分析系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:song132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络空间已成为消费者发表企业口碑信息的主要场所,同时也是企业收集消费者的反馈信息,发现产品缺陷与服务盲区的重要场所。然而面对海量的网络信息,仅仅依靠传统的人工搜集、整理和分析的方式已经不能满足现实口碑监测工作的需要。因此,建立一个智能化的网络口碑监测平台对于企业改善自身素质、增强竞争力具有重要的意义。本文依托于网络口碑监测平台的建设,结合平台的功能需求,设计并实现了一个智能化的网络口碑分析系统。该系统采用Web文本挖掘技术,实现对海量口碑文本的自动提取、筛选、识别和分类。本文的工作主要包括:1)分析比较现有的网页解析技术,采取基于XQuery模板的方式,实现对网页文本元数据的精确抽取;2)分析比较现有的信息过滤技术,采用基于支持向量机的文本二值分类器,滤除平台无需关注的信息,保证后续数据分析的准确性;3)采用多模式匹配算法,结合预设的产品匹配规则,快速识别出口碑文本涉及的产品;4)通过“一对多法”构建支持向量机文本多分类器,对口碑文本按预设的分类体系进行自动分类。本文最后对系统进行了测试,测试结果表明系统达到了预期的设计要求。目前,该系统已成功应用于网络口碑风险监测平台。
其他文献
今天,我们欢聚一堂,隆重纪念中国人民广播事业暨中央人民广播电台创建65周年。首先,我代表国家广电总局,对出席纪念大会的党和国家领导人表示热烈欢迎和衷心感谢!对参加这次会议
<正>临床资料患者女性,67岁,因"间断咳嗽、咳痰2个月余,加重伴发热6d",于2016年3月16日收入院。2个月余前,无明显诱因出现咳嗽、咳黄痰,量少,不易咳出,无发热、畏寒及寒战,无
2010年5月26日-28日中国城镇供水排水协会设备材料工作委员会第四届水行业流量仪表选型与应用技术研讨会在山东省临沂召开。430余位供水行业人士参加了本年度最大的流量仪表
目的:比较人血清透明质酸(HA)夹心化学发光免疫分析和竞争化学发光免疫分析,对两种方法的相关性、线性范围和检测效果进行评价。方法:分别应用人血清HA夹心和竞争化学发光免疫分析
穴位贴药按压治疗青少年近视的近期疗效观察贵州省中医研究所附院(550008)唐仕勇【关键词】近视,穴位贴药,治疗应用笔者采用耳及眼周穴贴药治疗青少年近视数百例,获得满意疗效,现将96例资料
目的:PLK1在有丝分裂的不同阶段都发挥重要作用,是治疗恶性肿瘤药物开发的主要目标基因。紫杉醇是卵巢癌治疗最常用的化疗药物之一,但是,紫杉醇耐药是限制其临床应用的一个重要因
类风湿性关节炎(RA)为临床上的常见病、多发病。临床诊断均根据类风湿因子(RF)等项目测定诊断该病,但往往缺乏特异性^[1]。本文报告对RA患者血清IL-5、TNF-α和抗环瓜氨酸肽抗体(CC
心力衰竭是各种心脏病引起的心脏代偿功能不全所产生的一系列临床症状和体征,是迄今为止唯一发病率仍在继续增加的心血管病症[1].本文报告心力衰竭患者血清BNP、IL-6和IL-8水
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技