分词处理相关论文
随着互联网的快速发展,Web资源已成为企业获得竞争情报的重要来源。但是,从Web资源中获取的文本情报信息量往往比较大,来源广泛,不......
目前,Internet以惊人的速度向前发展,Web作为信息发布与处理的主要平台,蕴含着大量人们迫切需要的知识。而如何将Web中的海量信息中的......
在社交网络中,对于巨大数量的产品和服务,每天都会产生越来越多非结构化的在线评论。在线用户不仅表达对产品和服务的整体意见,还......
21世纪以来,伴随着信息化产业的迅速发展,越来越多的企业内部信息以数字化方式来存储,如何从海量的信息中准确检索到所需信息,成为一个......
该文的主要内容如下:首先阐述了Web挖掘的定义、挖掘任务的分类,Web文本挖掘的应用及方法:文本分类与文本聚类.该文在对文档的分词......
【摘 要】在专利检索系统中,专利信息采集模块是最重要的模块,它能保证查询到的专利信息是网络中最新的。本文详述了专利检索系统中......
摘要:互联网的发展为知识与信息的传播提供了前所未有的便利,但同时也为不良信息的传播提供了条件。高校作为互联网应用与研究的前沿......
超文本信息抽取是Intemet信息重组的重要手段。通过对政府公文信息格式进行了研究,提出了一种基于XML的信息抽取中间件模型,通过基于......
用户在使用关键词搜索时,对于一些不熟悉的领域,无法给出准确的关键词.为了解决这个问题,该文在开源全文检索工具包Lucene的基础上......
对对话管理系统中的自然语言理解技术进行了研究,提出了基于文法规则匹配的自然语言处理方法,给出了采用该方法实现的自然语言处理系......
以往使用的垃圾邮件识别方法在面对如今更新速度快且种类繁多的分词时,很难精准地识别出邮件中的关键分词,识别方法的应用能力需要......
为了防止互联网上非法信息的传播和浏览,对网上信息的内容进行主动监管,保护网络信息的安全,成为关系社会稳定的重要课题。设计并......
<正>用户舆情信息包括文本、音频、图片等各种各样的形式,实际工作中我们应用较多的还是文本类的用户舆情。综合考虑数量、丰富性......
随着互联网技术的发展,网络上出现了很多的问答系统,但是这些系统都只是围绕知识进行问答的活动,没有充分考虑到作为知识问答活动......