文档预处理相关论文
主题模型(Topic Model),顾名思义就是对文字中隐含主题的一种建模方法。主题模型在机器学习和自然语言处理领域中有广泛应用。通常......
缺点和不足,即基于关键字的信息检索系统无法保证用户查询的高质量反馈的问题,本文通过对语义检索和本体技术进行研究,将它们引入到信......
该文的主要内容是描述如何实现一个PDF格式转换模块,并添加到一个通用文档预处理模块结构中来增强系统功能。本预处理模块目前应用......
搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形......
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构......
评价智能答疑系统优劣的重要指标是准确率和召回率。系统结合Q/A库和文档库搜索技术的优势实现,利用成熟的Q/A技术回答常见问题,保......
作业环节是整个教学过程中的一个重要的环节,作业环节信息化是教育信息化中重要的组成部分。作业环节的工作质量、效率和效益直接影......