【摘 要】
:
自然语言处理的一个重要分支,即自动文本分类,是文本信息处理的重要基础,是人工智能研究的一个热点,有助于文本的信息管理。已经有大量的专家学者对朴素贝叶斯、神经网络、支持向量机、k近邻等传统算法进行研究,但大量的专家学者实验证明KNN、SVM等经典的文本分类算法大都基于向量空间模型,因泛化能力不足,导致对于复杂的文本分类结果较差。该文提出一种新的特征权重计算方法,充分利用文本结构特征信息对特征权重进行
【基金项目】
:
江西省教育厅科学技术研究项目(GJJ204203);
论文部分内容阅读
自然语言处理的一个重要分支,即自动文本分类,是文本信息处理的重要基础,是人工智能研究的一个热点,有助于文本的信息管理。已经有大量的专家学者对朴素贝叶斯、神经网络、支持向量机、k近邻等传统算法进行研究,但大量的专家学者实验证明KNN、SVM等经典的文本分类算法大都基于向量空间模型,因泛化能力不足,导致对于复杂的文本分类结果较差。该文提出一种新的特征权重计算方法,充分利用文本结构特征信息对特征权重进行计算,对于不同位置出现的词语赋予不同的权重,突出关键位置词语的重要性,同时考虑词分布密度对分类结果的影响,在分类模型中考虑词密度权重,优化TF-IDF算法。在2个语料库上的实验表明该文基于特征权重的分类算法较大地提高分类效果。
其他文献
近年来,国家外汇管理局为支持实体经济的发展,提高跨境融资的便利化水平,在多地开展了资本项目便利化试点,资本项目数字化服务试点,并陆续出台了跨国公司跨境资金集中运营管理改革、支付便利化、外汇账户精简等多项资本项目改革举措,这些创新举措不仅对于商业银行的创新发展带来新的机遇,也有助于形成全面开放新格局。银行在外汇管理方面被赋予更多的自主权,作为便利化政策的执行者,银行在政策实施过程中存在展业思路转变滞
基于专业大类实施差异化拨款制度,是职业教育落实中共中央办公厅、国务院办公厅《关于推动现代职业教育高质量发展的意见》的重要举措,也是遵循职业教育发展规律的重要体现,有利于提高财政投入绩效。基于专业大类实施差异化拨款的关键是要分析各专业大类生均培养成本,进而制订各专业大类的生均拨款差异系数。通过文献研究、政策研究、全国各省书面调研和湖南各职业院校现场调研,在数据校验、汇总、计算、分析的基础上,从职业教
对标RCEP经贸规则,是构建中国特色自贸港政策制度体系的重要内容,也是以高水平开放促进自贸港高质量发展的法治化保障要求。海南建设中国特色自贸港,核心在于构建开放型经济的法治保障机制。实施RCEP经贸规则,重在推进自贸港国际化、市场化、法治化发展机制。RCEP已是自贸港高水平开放的新标杆。推动制度集成创新是自贸港实现高质量发展的法治创新焦点,更是自贸港法规体系的重要构成部分。国际化发展的法律定位,是
文章通过对现行的平原灌区田间节水灌溉技术进行分析和删选,结合河套灌区的实际情况和田间灌溉特点,提出了适宜河套灌区应用和推广的四种田间节水灌溉技术:平地缩块改造畦田灌水技术、秋浇覆膜灌水技术、沟灌灌水技术以及地膜后茬免耕灌水技术,分析并评价这4种田间节水灌溉技术在河套灌区的适用性。
人类活动产生的温室气体引起气候异常已成为全球共识。水泥生产排放大量温室气体,2018年水泥生产碳排放占全球碳排放的8.7%。硫铝酸盐水泥由于原材料石灰石用量的减少和较低煅烧温度带来的碳排放比硅酸盐类水泥低的特点,在全球碳达峰和碳中和战略目标下,具有潜在的发展空间。基于生命周期评价理论与方法,建立了碳排放核算模型,对我国典型工艺生产1 t 42.5级硫铝酸盐水泥的碳排放进行了定量核算,同时与欧美等发
在建筑行业发展初始,国家各种标准不健全,因此在该产业发展并不规范。后来,随着建筑领域的红利凸显,越来越多的资本开始介入建筑领域。当时的企业侧重了短期效益,并没有对企业的发展做出太多的规划。在我国环保、建筑等政策逐步完善的背景下,传统的发展模式已经不符合企业发展战略趋势。A企业是一家传统建筑公司,成立于2004年,当时正处于我国经济发展的高峰期,建筑领域发展迅速,因此其也获得了发展契机。然而,在其快
针对分布式“马赛克战”场景下侦察-判断-决策-行动(OODA)环通信加速的要求,提出了基于机器学习链路权重优化的无人机集群网络路由算法。针对OODA环当前阶段业务量通信需求,对业务量通信的完成时间进行建模;以最小化业务量通信完成时间为优化目标,通过利用机器学习梯度下降方法实现无人机集群网络分布式路由链路权重的优化,从而满足OODA环的通信加速要求,使己方可以先敌行动,获得战场主动权。仿真表明,相比
目的通过调查上海市三级甲等医院消化科护理人员失禁性皮炎知信行现状调查,了解消化科护士对于失禁性皮炎的认知及护理现况,为开展具有针对性的专科护理培训提供指导及参考。方法应用护理人员失禁性皮炎调查问卷(该问卷Cronbach’sα为0.889,重测信度0.837,内容效度0.969)对上海市三级甲等医院109名消化科护理人员进行调查及分析。结果护士对失禁性皮炎的知信行总分为72.13±9.59,其中认
对熟料生产的料耗、组成和热耗及碳排放量进行计算;在计算碳酸盐热分解温度的同时,由热重(TG)测定石灰石中SiO2不同含量对碳酸钙热分解温度的影响;按照2022年中国碳价、国际碳价计算熟料碳税。结果表明,每吨水泥熟料的生料投料量为1507kg,其中石灰石投料量为1288kg、黏土为198kg、铁粉为21kg,所得水泥熟料含CaO为66.05%、SiO2为21.66%、Al2O3为5.56%、Fe2O
该文研究并提出了基于特征权重的地图匹配算法,实现了车辆的长时间间隔轨迹数据与路网数据的高效且精准匹配。该文提出的算法通过构建误差区域,并从路网数据和车辆定位数据的接近程度、车辆运行曲线和道路曲线的形状相似性、定位点与候选道路相对位置以及历史匹配路段与候选道路的连通性等4个方面对误差区域中满足合理可达性的全部候选路段进行地图匹配的加权计算,从缓冲区域内选择最大权重值的路段作为最终的匹配路段并显示车辆