基于机器学习的文本分类技术研究进展

来源 :软件学报 | 被引量 : 0次 | 上传用户:liongliong496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及Web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望.
其他文献
近年来,随着对外开放进程的逐渐加速,我国与海外国家经贸合作往来日渐频繁,国有资产出海规模不断扩大。然而目前,我国海外投资管控体系不完善,且多数国有企业对境外投资国市
信息工作如何为促进企业进入市场、增强企业活力服务。笔者认为首先必须转变观念,解放思想,大力宣传信息在企业中的作用,提高企业职工的信息意识;其次,信息部门要打破传统的信息服
集束化护理是指在循证医学的基础上,针对某种难治的临床疾病而制定的全方位联合治疗及护理措施[1-2],由美国健康研究所[3]首先提出,是有效实施“循证实践指南”的一种表述[4]。集束化护
介绍了我国市政公用设施领域现行工程建设标准的现状,揭示了为保障市政公用设施安全运行所面临的突出问题,探讨了构建相应主题标准体系的设想及预期目标。
物理教学中,教师要以对学生的爱为出发点,营造和谐的师生关系,从知识积累、意志训练、创设环境等多方面去培养学生积极、健康的情感,增强学习的动力,提高育人质量。
以办公室计算机办公软件为研究对象,分析了计算机办公软件应用的意义和优劣势,介绍了计算机办公软件了应用前景,提出了计算机办公软件的发展前景。为此,进一步开发办公室计算
针对目前企业中对仪器的操作控制还未实现自动化,导致企业员工的工作效率不高的难题,通过在Visual Studio 2010开发平台中采用C#编程实现基于GPIB通讯的多仪器控制设备,实现
完全学分制下贯彻的是一种“以学生为本”的教育模式,打破传统、积极创新,主动适应社会发展的需要,有利于促进高校教学管理水平的提高,从而培养出高素质的复合型人才。完全学分制
邮票选题一直受到广大集邮爱好者的关注,对于集邮者来说,我国某一年发行哪些题材的邮票,一定程度上决定了集邮者本年关注什么,去哪里寻邮,写什么题材的文章,甚至集邮者的心情
期刊