论文部分内容阅读
基于文本词频分布的zipf定律,将评论挖掘中的产品属性抽取问题转化为识别评语中的词频分布离群点,并且提出新的产品属性抽取方法.该方法首先从产品评论文本中识别出词频分布中的离群词,并将其作为候选的产品属性词,然后通过合并和过滤候选产品属性词得到最终的产品属性词.该方法比以往基于规则或者基于概率的方法更加简单高效.将该方法应用于亚马逊网站的3种产品的属性抽取,实验结果表明该方法在精确度上取得令人满意效果.