【摘 要】
:
针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词;在每一轮迭代中,通过计算提取词与提取模式的置信度确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率
【基金项目】
:
国家自然科学基金面上项目(61471083),国家教育部人文社科研究规划基金资助项目(14YJA630044)
论文部分内容阅读
针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词;在每一轮迭代中,通过计算提取词与提取模式的置信度确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率。实验结果表明,该算法对产品属性提取的F值可以达到78.97%,结果优于其他类似的提取算法。
其他文献
针对传统的基于RSSI的加权质心定位算法中使用静态权重因子指数只能使部分区域的误差得到明显改善而其他区域的误差相对较大的现象,提出了一种基于动态权重指数的四点定位算法。在矩形区域中,通过构造权重因子指数矩阵,使不同区域拥有相对最优权重因子指数。在实际运算时,首先通过传统加权质心算法判断未知节点的大致位置;然后通过查询指数矩阵确定相对最优权重因子指数并重新计算未知节点坐标,并作为未知节点实际坐标。通
针对序列图像,提出了增强型无参考质量评价的图像自动选优策略。首先在详细介绍SSEQ、NIQE和BIQI三种经典的无参考图像质量评价方法优缺点的基础上,提出了加权的质量评价策略以对序列图像进行自动选优。其次为了加快权重寻优的过程,提出了基于粒子群优化的PSO-WNRIQA算法。最后为了评估算法的性能,提出失序数比例DNR和失序对数比例DCNR作为算法评价标准。通过对LIVE Release 2图像库
目的:研制环孢素A滴眼液.方法:以乙醇溶解环孢素A,吐温-80作乳化剂,与鱼肝油形成乳剂.采用HPLC法[1]测定环孢素A的含量.结果:含量测定方法平均回收率为99.21%,RSD为0.93%,n为
针对凸松弛方法在解决三维人体姿势估计的问题时存在迭代次数较多、准确度不高的不足,提出一种基于遗传优化的自适应凸松弛人体姿势估计算法。该算法首先对关键参数的更新方式进行自适应处理,然后利用遗传优化算法对该关键参数的初始值进行寻优,最后利用寻优结果对凸松弛方法中闭式解的公式进行调整。实验结果表明,提出的算法迭代次数更少,准确度更高,更有利于实际应用。
近年来随着我国经济的飞速发展,人民生活水平的不断提高,我国冠心病和高脂血症的患病率呈上升趋势.因此,如何有效的降低血脂水平防治高脂血症一直是广大医务工作者探讨的重要
针对目前显著性检测算法在复杂多目标遥感图像中检测能力不足的问题,提出一种结合显著性检测和超像素分割的遥感信息提取算法。该算法通过GBVS(graph-based visual saliency)方法检测出原始影像中部分显著性较高的区域,然后利用SLIC(simple linear iterative clustering)方法分割显著区域,并修正显著区域边缘得到训练样本数据,进一步对训练样本进行统
精神疾病具有特殊性,患者的认知、情感、意志活动会有不同程度的障碍,一些严重者会出现危及自身、他人及社会安全的行为,给个人、家庭和社会造成巨大影响,必须及早治疗.然而
本文对我科于1991~2000年间诊治的喉结核16例的临床资料进行分析,借以探讨喉结核的临床特征,提高临床对本病的认识,减少误诊误治,现报告如下.1 临床资料1.1 一般资料 16例中,
针对在现代木材加工企业中,实木板材以缺陷及纹理为主要品质分级要素的需求,提出利用基于局部二值模式、自学习的深度置信网络与softmax分类器组合的深度学习算法,实现对实木板材缺陷及纹理的分类。首先提取实木板材的缺陷及纹理特征,在此基础上利用深度置信网络对经过局部二值化处理的特征进行训练学习,并采用可自学习的学习率算法优化收敛速度、减少训练时间,最后使用softmax分类器获取常见缺陷及直纹、花纹的
零售企业面临着各种商品信息的充斥,如何帮助零售企业高效准确地获得有效的商品销售策略,是一个亟需解决的问题。基于复杂网络理论,构建了零售商品关联的复数权网络模型,以消费者购买记录中零售商品购买的先后关系为出发点,零售商品作为节点,不同商品间的先、后购买关系作为有向边,先后购买关系对销量的贡献作为权;然后计算各商品节点的强度;最后用电子商务网站和超市销售账单数据对该算法进行了验证。本研究对电子商务网站