基于逻辑回归的中文在线评论有效性检测模型

来源 :东南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wanjjsaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现电子商务和社交网络中文在线评论有效性的自动化检测,提出了一种单一主题环境下基于逻辑回归的垃圾评论检测模型.中文在线评论有效性的检测可以归结为分类问题,结合中文在线评论的特点提取了9个特征以构建分类模型;为获取核心特征主题的相关度,采用基于关联规则的评论名词模式优化了ICTCLAS中文分词系统的主题识别,进而利用交叉语言模型获取在线评论主题相关度.实验中采取了人为标定的1 000条评论作为样本,把支持向量机分类模型作为对比进行试验,利用数据挖掘工具Weka进行计算.结果表明,采用优化评论名词模式下基于逻辑回归的垃圾评论检测模型结果的准确率达到83.54%,比支持向量机分类模型计算得到的准确率高2.10%.
其他文献
本实验用盐酸活化凹凸棒石,然后采用化学沉积法制备磷酸铝/凹凸棒石纳米复合材料,探讨了磷酸铝用量、反应体系pH值、反应温度和反应时间等因素对磷酸铝/凹凸棒石纳米复合材料
将氢氧化镁(MH)或氢氧化铝(ATH)添加到乙烯.醋酸乙烯酯共聚物(EVA)/低密度聚乙烯(LDPE)中,通过拉伸试验测试材料的拉伸性能变化规律。研究发现,随MH或ATH含量增加,EVA/LDPE复合材料的拉伸强
通过单因素及正交试验研究了温度、pH值、沉淀时间、反应物浓度和成核剂5个因素对微生物诱导CaCO3沉淀量的影响,以期提高微生物沉积碳酸钙的产率,为微生物修复技术的时效性提
通过观摩英语课堂,针对教师的课堂活动指令语下达的正误率进行了统计,发现一部分教师的课堂活动指令语存在误用或低效等问题。针对这些问题而设计的"活动指令语诊断卡"能帮助
以钙钠基膨润土为原料,首先对其钠化改型得到适合制备柱撑膨润土的基质,然后使用交联法制备不同OH^-含量的Ce柱撑液,进一步制备Ce-柱撑膨润土,以其为载体用浸渍法制备Ni2P/Ce—PIL
磷石膏中含有少量可溶磷等杂质,作为石膏胶凝材料直接使用存在不利影响。利用快烧处理3种不同磷杂质含量的磷石膏,通过控制快烧温度和时间,研究了快烧后磷石膏总磷、可溶磷和
研究了热反射颜料的光学性能对彩色反射隔热涂料隔热性能的影响。制备了黄色、灰色、棕色3种色系彩色反射隔热涂料,并与同色系普通隔热涂料做了性能对比。测试结果显示:灰色
思乡与返乡是客居他乡的族裔群体的一种精神状态,家园意识在客居异国的人看来是对过去经历的回忆和想象。作为美国华裔诗人,'家园'一直是李立阳的创作主题之一。在他
温石棉尾矿煅烧活化产物酸浸渣的主要化学成分为无定形二氧化硅,由于受到煅烧的作用,温石棉尾矿中硅氧架状结构受到破坏,生成更多的化学断键,增大了其活性。采用NaOH浸取其中的二
在实验室奈件下,以石灰石为原料,通过间歇式碳化反应合成了纳米碳酸钙产品。通过单因素条件试验,在CO2流量为1.0L/(h·gCa(OH)2),碳化初始温度为20℃,Ca(OH)2浓度控制在8wt%时,可以制备