融合信息熵与多权TF-IDF的营销评论关键词提取算法

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:good2009good
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统分词算法、传统提取关键词算法对现代营销活动中以客户为中心,分析客户评论,提取重要客户的需求具有局限性等问题,提出融合信息熵和多权TF-IDF关键词提取算法。该算法首先运用结合互信息和左右熵分词算法对标题、用户评论进行分词,产生新词;再运用TF-IDF算法抽取评论关键词、标题关键词,根据关键词的位置因子、词性因子、词长因子加以不同的特征权重,避免忽视标题和评论的不同重要性,提高结果精度;利用余弦相似度对两者的关键词进行相似度的比较,从而确定该评论的质量。实验结果表明:从互信息、左右熵、词语的位置,词
其他文献
随着无线通信技术、嵌入式医疗传感器技术的迅速发展,无线体域网(WBAN)技术得到了广泛的应用,如何有效地保护WBAN中数据共享时数据的安全是一个亟待解决的关键问题。考虑到WB
在大视差岩心图像拼接中,传统的图像配准算法难以对齐图像,最佳缝合线算法融合的图像也不自然。针对这一问题,本文提出了一种基于改进最佳缝合线的大视差岩心图像拼接算法。首先,用贝叶斯特征模型剔除匹配异常值,再由正确的匹配点构造变形函数;其次,对重叠区域中间部分进行图像变形以对齐图像,在该区域建立最佳缝合线的能量函数,并引入视差信息到能量函数当中,以减小视差误差;最后,利用动态规划思想找到最佳缝合线并缝合
在物联网、移动互联网、卫星定位、移动应用、云计算、大数据等技术构建日益成熟之际,运用智能手机移动应用,向社会公众实时发布主要的环境卫生数据信息;把PC端监管动态信息
由于IPv6地址空间巨大,使得IPv6网络拓扑测量成为一个巨大的挑战。本文基于IPv6存活地址列表,提出了一种IPv6网络拓扑测量目标选取技术,来提高IPv6网络拓扑测量的有效性和完
在现代园林绿化中,花卉属于非常重要的材料之一,花卉和乔木存在本质上的不同,对环境和养护条件都有着更高的 要求,在花卉培植的过程中,任何环节出现问题都可能影响花卉的正常
汽车制造领域L4以及更高级别的自动驾驶技术已经成为当今汽车行业最前沿的发展方向。智能驾驶汽车在行进过程中对公路上的交通标志的识别可以有效帮助驾驶员及时做出决策,降低交通违法和交通事故的发生率。目前智能交通标志识别系统仅可在少量指定车型中使用,普及率较低。为使更多的驾驶员可以使用智能交通标志识别系统完成辅助驾驶,本文对中国标准交通标志数据库(CCTSDB)进行研究,提出了一种基于残差神经网络的智能交
随着无人机技术的逐渐成熟,越来越多的物流企业开始将无人机投入到快递运输过程当中,无人机和物流车协同配送的车辆路径问题成为当前学术界和工业界的热点问题。本文将无人机投入到配送过程中协助配送,更好地提升客户体验和满意度,提出了基于时间成本和行驶成本的无人机物流车协同配送优化算法这一个研究课题,随后提出了一系列算法并进行实验验证,包括二次聚类算法、基于禁忌搜索算法的无人机-车协同作业优化算法。实验结果证
为了改善鲸鱼优化算法(WOA)的不足,如容易陷入局部最优,收敛速度慢等问题,本文提出了改进鲸鱼优化算法。首先,通过混沌Tent映射随机生成算法的初始种群位置,让种群分布更均匀
2020 年伊始,从武汉爆发一种传染性极高的疾病,命名为“新型冠状病毒”,十堰市也很快出现了相关病例。为了抗击 此次疫情,十堰市政府联通企业、非政府组织以及民众协同应对此
本文运用故障树分析法,建立钻井井塌事故的事故树模型,通过计算最小割集、最小径集、结构重要度进行定性分析。通过对井塌事故定性分析可知,有192条路径会导致钻井井塌事故的