基于词频离群分布的在线评论产品属性抽取

来源 :信息系统协会中国分会第四届学术年会 | 被引量 : 0次 | 上传用户:lfm888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于文本词频分布的zipf定律,将评论挖掘中的产品属性抽取问题转化为识别评语中的词频分布离群点,并且提出新的产品属性抽取方法.该方法首先从产品评论文本中识别出词频分布中的离群词,并将其作为候选的产品属性词,然后通过合并和过滤候选产品属性词得到最终的产品属性词.该方法比以往基于规则或者基于概率的方法更加简单高效.将该方法应用于亚马逊网站的3种产品的属性抽取,实验结果表明该方法在精确度上取得令人满意效果.
其他文献
采用统计机器学习方法,对面向情感分类的中文在线评论特征项的选择进行研究.选取词性、词性组合、n-gram作为情感文本的潜在特征项,利用文档频率法对特征项实施降维处理,采用
会议
鸡西矿业集团公司张辰煤矿西三采区3
期刊
随着互联网的发展和网络信息量的急剧膨胀,搜索引擎逐渐成为人们搜索资源的重要途径,如何准确便捷地响应用户需要以及如何满足用户个性化需求、提高响应需求的精准性成为框计
This paper presents a new measurement system based on integration method that can provide all-weather dependability and higher precision for the measurement of FASTs feed support system. The measureme
在面向服务的应用中,服务集成商通过选择已有服务并对这些服务进行组合,为其消费者提供增值(value-added)服务.Web服务组合是Web上服务集成的有效机制.本文从知识发现的角度,
挖掘在线评论中产品特征及评价已经成为提高电子商务服务质量的重要手段.本文根据中文评论的特点,首先总结出特定的句法结构模板,然后结合此模板与制定的4条抽取规则,完成对
亚波长周期结构光栅具有传统光栅所不具有的特殊特性,因此利用纳米压印技术在方形的PC(Polycarbonate,聚碳酸酯)上制作了一种亚波长金属纳米光栅偏振器,其周期为278 nm,深度
Observations of the second solar spectrum(SSS)revealed the existence of prominent linear polarization signals due to lines of the C2 molecule.Interpretation of
乳化溢油是溢油进入海域之后与海水相互作用产生的一种溢油污染形态.而这种形态在开展激光诱导荧光(LIF)探测时表现出不同于其他形态的特性.因此,从荧光光谱的角度出发,以柴
传统发展经济学背后的一些基本思想可能确实导致了一些世界目前面临的经济挑战。特别是,如今很显然光是保持平衡国民预算和控制通胀而让市场来完成剩余工作是不能自动产生持