基于词频和情景语义的产品特征提取方法

来源 :广西大学学报:自然科学版 | 被引量 : 0次 | 上传用户:grasskeeper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决目前产品特征提取方法在种子特征词集构建上存在需要大量人工标注、代表性不足等问题,提出一种基于词频和情景语义的产品特征提取方法。通过少量高频名词和关联规则构建种子特征词集,采用神经网络语言模型进行词向量训练,再通过计算向量间余弦相似度对种子特征词集进行扩充,最后经人工分类后得到完整的产品特征词典。实验结果显示,该方法采用种子特征词集相似度排名前九的单词(top9)来进行产品特征扩充时效果最好,F1值达到了76.44%。此外,与K-means+Word2vec、LDA等方法在top5,top10,top
其他文献
快乐的时光总是过得特别快,在梦中,我还在尽情回味着家人聚会时的欢笑,可当同屋兄弟那质朴而又彪悍的鼾声传来时,我才恍然大悟,原来自己已经睡在寝室的下铺。2008年的暑假又完了,我在心中轻轻一叹,翻起身来随手打开电脑,却没有料到,这原本最亲密的“兄弟”也耍性子罢工了……    速查第一步,连线看看看    两个月没见,明显感到电脑上蒙了细细的一层灰。可这还不是问题的关键,现在是电脑完全不能启动了。怎么
餐厨垃圾预处理阶段物质分选对整体处理工艺影响较大,如果分选不到位,浆料中杂物多,会导致管道磨损严重、设备故障率高等问题。通过调节进料频率及大物质分选机的运行频率,探
欢欢喜喜地将WinXP升级到SP3,却发现桌面上的IE图标不见了乙对于那些喜欢用第三方浏览器的朋友来说,这也许压根就不算什么问题;但对于我这个坚定的“原教旨主义者”来说,桌面上没
目的通过千金子生态适宜性评价,为选取优质千金子种植区域提供依据。方法通过网络资料查阅和实地采集,收集千金子149个样点信息,综合55个生态因子,应用地理信息系统和最大熵
为了解决普通取心钻具在软弱、松散性复杂地层钻进中的取心问题,降低堵心、磨心概率,提高钻进回次进尺长度和岩心采取率,研制了安装在普通S95绳索取心钻具上的一种新式岩心提
针对传统的电网TD-LTE网络模式一直存在网络通信不稳定、效果差的问题,对智能电网TD.LTE网络模式重新进行分析研究。在给出TD-LTE网络结构图的基础上,分析其固有问题原因,并通过
机会网络提供了时延容忍的端到端消息传递,而基于泛洪的路由协议常用于机会网络。然而,基于泛洪路由导致高的资源消耗和缓存区域拥塞。为此,提出基于复制概率的机会网络路由
研究目标检测、背景提取、目标像素的处理、跟踪框生成算法,详细分析目标离开侦测算法的思路和原理,实现目标离开算法在不同环境下的识别、跟踪。通过测试结果表明,该算法模型在目标离开过程的侦测、跟踪效果都表现的不错,算法的效果良好。
6-氯咪唑并[1,2-b]哒嗪-3-甲腈是抗癌新药新型TGF-βR1抑制剂BMS-986260的关键中间体。以水合肼和马来酸酐为起始原料,在酸催化下发生缩合反应,再用三氯氧磷进行氯化,与氨水
目的系统整理和分析了茜草科瑶族药材(以下简称"瑶药")的药用品种、基原、药用部位、功效及标准等。方法通过查阅文献及分析的方法对瑶族医药进行考证。结果茜草科瑶药共有22