社区问答服务中的问题分类任务研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:blue_lnan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类似“百度知道”这类社区问答服务系统的主要任务之一是对问题进行分类,以便于对用户的提问进行组织。社区问答服务的实际应用需求对问题分类算法提出了高准确性、小计算量、对噪音数据敏感度低等要求。基于KullbackLeibler Distance的分类算法在大规模文本和高维向量分类任务中表现出较高的分类精度,本文在该分类算法的基础上,结合语言模型的思想,提出一种改进的分类算法:ngram KLD。通过在一个大尺度的问答对数据集合上进行的一系列实验,表明ngram KLD算法在问题分类任务中取得了优于传统算
其他文献
为了贯彻落实中央八项规定和省委十项规定,今年以来,雅安市各民主党派以加强制度建设为重点,着力打造“学习型、服务型、效能型、节约型、和谐型”机关。一是建设学习型机关,着力
针对目前最新发展的Bandelet变换的特点,本文提出了基于第二代Bandelet变换的彩色图像去噪算法,充分利用彩色图像内在的几何正则性,自适应获得彩色图像的最优表示,通过噪声强度设置阈值,并利用软阈值函数实现彩色图像去噪。通过MATLAB实验结果表明,使用该算法去噪后的彩色图像,无论在主观视觉效果上还是客观质量指标上都比小波和第一代Bandelet算法有显著提高。
x86是目前应用最广泛的复杂指令(CISC)系统,对大量非典型特性进行支持,从而花费大量硬件资源。而非典型特性的支持往往会影响典型功能的效率,不利于硬件资源的优化配置,限制处理系
利用多光谱传感器对同一观测对象在多个窄光谱范围上获得的图像,称为多光谱遥感图像。这类具有高空间和谱间分辨率的谱图像数据量大,其存储和传输都比较困难。因此,对海量数据进行有效的数据压缩便成了遥感资料应用中迫切需要解决的问题之一。为了防止有用信息的丢失而影响图像的进一步处理和应用,采用无损数据压缩方法是解决该问题的有效途径之一。本文分析了多光谱图像的空间和谱间相关性等特点,从多光谱图像预处理、预测和变