基于逻辑斯蒂模型的文本分类研究

来源 :中国高新区 | 被引量 : 0次 | 上传用户:wayaya123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前生活中,各类计算机软件系统或者APP每天都大量的产生文本数据,这些文本数据都是以非结构化的形式存在的,如果依然使用传统的人工分类的方式,效率是极其低下的,而且文本手动分类还有可能出现人为的失误。因此,本文提出在机器学习中根据监督学习模型的特点,利用逻辑斯蒂函数对未分类的测试样本集进行分类。实验结果表明,该算法模型根据事先提供好的训练集,自动修正直线的斜率和截距,自动修正模型的参数,训练集样本数据越多,模型的参数越准确,分类效果越精确,最后根据修正好的参数模型对测试样本集进行分类,预测分类正确、分类效率和准确度较高。
其他文献
随着我国高铁里程的不断增长,高铁运维自动化的应用需求急剧增加。接触网是电气化铁路重要的行车设备,是保证高速铁路安全可靠运行的重要组成部分。接触网系统一旦发生故障将引发重大行车事故,给人民生命财产带来巨大的威胁与损失。现阶段,铁路部门对接触网故障的检测主要依靠技术人员以人眼看图的方式判断巡检车辆采集的接触网图像数据中是否存在故障,这样的检测方式受限于技术人员的个人经验水平、注意力的集中程度等诸多不可
合理的产品定价技术是保险公司管理与控制风险的基础。在定价过程中,如何估计未来死亡率的变化是非常关键的环节。近年来,由于社会经济水平的整体提高,我国人口死亡率整体呈
习近平总书记在中央财经领导小组工作会议上提出"供给侧改革"后,各地纷纷从各领域开始有关供给侧改革的思考,高等教育领域也不例外。本文从理解供给侧改革出发,根据对长春校
土壤铬污染对人类健康有严重危害,对此,本文阐述铬在土壤中的形态及土壤中铬的标准值,介绍固化/稳定化法、电动修复法、化学淋洗法、生物修复法等多种铬污染土壤的修复方法,
中国资源植物丰富,蕴藏着优异的基因资源,开发和利用这些优异资源是植物学研究的重要课题。本文面向国家重大需求选择两种资源植物―羊草(Leymus chinensis (Trin.) Tzvel)和
随着零售业的发展,大型的超市也越来越多,当然竞争也就日趋激烈,想在众多的零售业当中脱颖而出,不是一件容易的事情。首当其冲的是零售业的促销策略,这也是很多大型超市屡试
随着生鲜电商市场规模日益扩大,"最后一公里"配送所蕴含的商业价值越来越明显。解决"最后一公里"配送问题对于生鲜电商企业降低物流成、提高物流效率、提升顾客满意度十分关
银行是现代金融的核心,银行业的发展对国家和地区的经济发展及政治稳定起着至关重要的作用。面对当前国际金融形势的风云变化,A城市商业银行对公业务发展也面临着诸如资本约
随着我国科技水平的不断提升,图像识别技术也有了明显的改进,计算机智能化图像识别技术已经成为新型的发展趋势,该技术的应用提高了图像获取的质量,图像所提取信息的真实性也
针对双有源桥式(Dual Active Bridge,DAB)变换器系统受到扰动时动态响应速度慢,基于微分平坦理论,结合单移相控制,提出了一种平坦控制策略。设计DAB变换器平坦控制系统,包括