结合语言模型的自动文本分类的应用研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:mrcool111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究统计语言模型中bigram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出一种利用词对及词序信息来改善文本分类结果的方法。实验结果表明该方法是可行且有效的。
其他文献
描述一种新型的基于Workflow技术、Ajax技术和模板页控制技术的IP地址管理系统设计与实现。整个系统的设计分为消息管理模块、用户登录模块、人工管理模块、IP地址管理模块、
针对目前复杂几何模型在三维仿真中建模困难的现实,提出一种三维重建方法。本文采用Visual C++编程语言,对几何模型的STL和3DS两种格式的数据文件设计相应的读取程序;以OpenGL图形接口为基础设计几何模型绘制程序,实现三维几何模型的重建。
针对目前主流数据库的安全审计系统中存在的获取信息的冗余性、滞后性及严重影响数据库性能的问题,对现有的数据库信息获取技术进行分析并加以改进,将VC和C#结合开发了一套数据
介绍数字信息管理自由报表设计打印系统的设计与实现,该系统借助于成熟的应用软件设计技术和软件开发平台,为用户提供一个报表二次开发平台。该平台可同时提供独立运行和动态
分析当前高校计算机实验室管理和维护中存在问题,提出利用旧硬件解决软件安装冲突和数据安全问题的方法,并对双硬盘双操作系统解决软件矛盾和利用旧服务器避免数据丢失的问题
分析了Eclipse的插件体系,并根据实际需求对uDig的功能进行扩展,提出在Eclipse平台上设计和实现uDig插件的方法,并利用Eclipse的插件开发方法实现uDig插件。
分析了WiMAX的关键技术及其应用场景,与其它无线网络接入技术进行了对比研究,探讨了WiMAX技术作为校园无线网络接入技术的可行性,设计了基于WiMAX技术校园网的建设方案,提出了WiM
目前多数RFID读写器只有一个大致的读写区间,而不是一个准确的读写距离。这使得当发现读写距离不能满足要求时,必须手动更改,给应用带来诸多不便。本文针对这一问题实现了一种优化方法,即实现一种基于自动循环调整RFID的增益算法,运用于基于RFID增益算法的矿产资源管理系统之中的运矿车辆的自动识别环节中。
随着互联网的飞速发展和目前传统搜索引擎存在的各种弊端,个性化搜索引擎的出现成为了一个必然;同时随着信息过载问题的出现,个性化推荐系统也已成为了不少领域关注的热点。本文
为了满足特定用户对于Web系统Word文件输出流格式的需求,在J2EE平台上对Java2Word类库进行二次开发,给出一种可自定义的输出Word文件格式的设计思路和方法。在数字化档案馆系