【摘 要】
:
识别搜索引擎用户的查询意图是在信息检索领域一个备受关注的研究内容。本文提出了一种融合多类特征识别web 查询意图的方法。具体地,本方法将Web 查询意图识别作为一个分类问
【机 构】
:
哈尔滨工业大学信息检索研究中心,哈尔滨,150001
论文部分内容阅读
识别搜索引擎用户的查询意图是在信息检索领域一个备受关注的研究内容。本文提出了一种融合多类特征识别web 查询意图的方法。具体地,本方法将Web 查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容以及Web查询日志中抽取出有效的分类特征。在人工标注的真实web查询语料上采用本文的方法进行查询意图识别实验,实验结果显示本文采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征对88.5%测试查询得到了准确的意图识别结果。
其他文献
在企业并购中引入对赌协议本身就是一场博弈,而市场竞争,同样存在博弈.博弈双方应对自身、未来市场前景以及企业未来发展目标有清晰的了解,具备足够的风险承受能力,双方协商
更新摘要假设在用户已经读过某话题的一些相关文档的情况下,对新来的该话题相关文档集合自动生成摘要。可以看出,它除了要解决传统的面向话题的多文档摘要的两个要求(话题相关性
财务智能化技术的加速发展直接影响到会计职业的变革,而会计职业变革与会计人才的培养模式密不可分,只有了解技术变革的逻辑及现状,才能准确推断会计职业变革的趋势,进而把握
博客飞速发展,博客文本检索和分类的研究价值日渐凸显。博客文本的内容、风格缺乏规范性,为自动文本分类带来难度。博客作者通常为文章指定一个或多个标签,标签在很大程度上概括
现阶段,我国的社会主义经济正处于转型阶段,这为社会经济的发展与人们的生产生活中带来了巨大的机遇与挑战.目前,企业间的竞争加大,利润空间减少,经营风险不断加大.企业要提
针对问句分类过程中词袋方式特征选取所面临的数据稀疏以及特征空间维数过高的问题,提出了一种结合词语相关性与流形学习的分类方法,该方法通过统计选取训练语料库中高频词作为
近年来,受到经济环境的影响,国内外石油价格持续走低,对石油企业造成了极大的冲击,全球各大石油公司业绩不断下降,“亏损”“大幅减利”频频见诸报端.在低油价背景下,国内外
本文研究了一种基于分类的用户兴趣模型。该模型主要将用户查询历史和用户感兴趣的相关文档视为用户兴趣数据的来源,来挖掘用户兴趣信息。根据向量空间模型,我们将基于分类的用
文本情感倾向性分析的基础是词汇情感倾向分析,本文针对基于词典的词汇情感倾向性分析方法中对情感词倾向绝对化标注问题,提出了一种获取上下文相关的词汇情感倾向方法。同时针
在企业管理工作当中,财务管理工作是重中之重,并且也给很多实际工作的开展提供了很大的支持.可以说财务报表可以直接反映出企业的财务情况,这也可以体现出其经营状况,同样也