基于PCA与协同训练算法的虚假评论识别研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:golf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在虚假评论识别研究中,针对监督学习框架下大规模标注数据集难以获取的主要问题,提出一种PCA与半监督协同训练算法结合的识别方法。上述方法首先从评论文本及评论行为两个独立视图构建初始指标体系,然后利用主成分分析法进行特征提取,消除初始指标间的相关性,最后针对不同视图的差异挑选出基分类器进行协同训练,以完成对虚假评论的识别。实验结果表明,所提方法较传统方法具有较好的识别性能,更能有效利用未标注样本辅助模型学习,同时主成分分析能降低原始样本的冗余度,提高模型的分类效率,为相关研究及应用提供一定的方法参考。
其他文献
通过对普通平型输送带进行改进,研制耐用矿砂输送带.在普通平型输送带覆盖胶中加入经预处理的聚酯短纤维,在平基带体上覆盖胶层设置间距合理的V形橡胶防滑棱,可有效提高输送
首先介绍了连续激光器单管老化试验,试验通过测试不同老化时间激光器腔面的烧毁功率,对腔面烧毁发生的过程进行了分析。分析认为,大功率半导体激光器腔面烧毁失效的根本原因
中药盐水制不仅对药物中的一些有效成分起助溶作用,从而增强临床用药的疗效;又可选择性降低一些药物成分的量而降低其毒副作用。方法;从盐水制药对药物化学成分物研究,证明盐水制
结合工程实例,介绍型钢混凝土组合结构施工工艺及施工难点,通过对型钢混凝土二次深化设计,对关键节点进行处理,合理安排工序,确保质量及工程施工进度。
目的探求一种安全高效的驱治高原鼠兔球虫的方法。方法选用复方伊维菌素干悬浮剂和天字球虫粉2种抗寄生虫药,采取经口给药(灌服和加入饲料、饮水),观察驱治效果。结果实验室
本文建立了一种测定牛奶和奶粉中地塞米松残留量的液相色谱-质谱/质谱方法。样品用乙腈提取,C18固相萃取柱净化,液相色谱-质谱/质谱仪测定,采用基质匹配外标曲线法定量。在2.0—400
本文将白居易家族相关人员的新出土墓志与传世文献结合起来,厘清白氏家族与杨氏、皇甫氏、张氏家族的婚姻关系,并认为白居易家族在选择婚姻对象时有重文学传统、重进士科第、
介绍了瑞典产Skaltek A20S型剥铅机橡胶提升输送带的研制过程.该输送带可分为平基带体,波形挡边和横档板3个分体件,三者先分别生产并预硫化然后按照成品带要求的尺寸用自行研
在阐述超限货物定义及特征的基础上,针对超限专业技术人员充足、超限运输组织程序规范、通行能力控制因素清晰、货物运送安全质量良好等运输优势,以及运送网络通过能力不统一、
【目的】全面了解绵羊卵巢组织mi RNAs表达情况,分析产单羔和产双羔绵羊卵巢mi RNAs表达差异,从而为探讨mi RNAs在繁殖力调控中的作用提供依据。【方法】应用多物种mi RNA芯