切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于大规模中文搜索引擎的搜索日志挖掘
基于大规模中文搜索引擎的搜索日志挖掘
来源 :计算机应用研究 | 被引量 : 48次 | 上传用户:zx0755
【摘 要】
:
从中英文用户的搜索习惯差异的角度出发,引入中文分词技术对中文搜索引擎的搜索日志进行了分析。重点分析了用户输入搜索词的一些规律,包括选择的语言、搜索词的长度和频率、高级搜索技巧的使用以及搜索词的修改情况;还提出了用户提交搜索词的模型,给出了历史搜索词对搜索结果的影响因子算法。
【作 者】
:
陈红涛
杨放春
陈磊
【机 构】
:
北京邮电大学交换与智能控制研究中心
【出 处】
:
计算机应用研究
【发表日期】
:
2008年06期
【关键词】
:
搜索引擎
数据挖掘
搜索日志
分词
search engine
data mining
query log
segmentation
【基金项目】
:
国家“973”计划重点资助项目(2003CB314806)
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从中英文用户的搜索习惯差异的角度出发,引入中文分词技术对中文搜索引擎的搜索日志进行了分析。重点分析了用户输入搜索词的一些规律,包括选择的语言、搜索词的长度和频率、高级搜索技巧的使用以及搜索词的修改情况;还提出了用户提交搜索词的模型,给出了历史搜索词对搜索结果的影响因子算法。
其他文献
跨声速翼型风洞数据库管理系统
本文主要介绍在西北工业大学跨声速翼型风洞(TAWX)中的PC/XT微机上,采用数据库管理软件 C-dBAsE Ⅲ,对该风洞翼型实验数据、计算数据,几何数据和应用程序进行系统化管理的方
期刊
翼型
跨声速
风洞
数据库
管理系统
transonic airfoil
data base
management system
基于知识进化算法的生产采购协同计划问题研究
研究了考虑价格折扣的单工厂、多产品、多周期的生产和采购协同计划问题,构建了生产采购协同计划模型,提出了用于求解该问题的知识进化算法方案,阐明了该算法方案的具体实现
期刊
生产批量计划
采购计划
知识进化算法
lot-sizing problem
purchase planning
knowledge evolution al
一种改进的回溯事件检测算法
重点研究事件检测模型中层次聚类算法的改进,提出利用在关键词抽取基础上利用新闻的各种要素信息计算新闻之间相似度的方式,搭建了一个在线新闻检索系统,在其上利用新华社的新闻语料进行实验。实验结果表明改进方法的效果明显,性能较之未使用前有显著的提升。
期刊
事件检测
聚类
关键词抽取
event detection
clustering
keyword extraction
面向服务的内容适配框架研究
将面向服务的体系架构引入内容适配研究,设计了一种新颖的面向服务的适配框架,并阐述了框架的运行机制。该框架在复用性、扩展性等方面具有良好的性能。
期刊
内容适配
面向服务架构
适配框架
适配操作服务
基于UML序列图的测试方法
提出了一种基于UML序列图的面向对象类簇级测试的方法。这种方法根据序列图进行分析提取类交互信息和用户的输入数据生成测试用例,并根据序列图对代码进行插桩,构造测试模块;最后测试驱动器执行测试模块得到测试结果。该方法也支持UML2.0中为序列图添加的新特征。
期刊
规格说明
面向对象
统一建模语言
序列图
软件测试
specification
object-oriented
UML( unified modeling
异常值的甄别与剔除
本文从压力传感器的校准数据着手,应用格拉布斯(Grubbs)准则,识別摻杂于大量实验或检测数据中的假数据,并正确地将其剔除,从而提高实验或检测的真实性和正确地评定传感器的精
期刊
格拉布斯准则
传感器
异常值
Grubbs′crubbs′criterion
calibration data of transducer
source o
串置双五分量知平的研制
本文介绍风洞应变天平中首次研制成功的一台串置双五分量天平。串置双天平由一块钢材制成。O_1天平固定在 O_2天平的受力端。O_2天平既能测量左平尾载荷,又能传递由 O_1天平
期刊
串置双五分量
天平
受力分析
风洞
A serial twin five-component balance
analysis of force
calib
轴流压气机非定常流及端壁边界层测量中的热线技术
本文总结了测量轴流压气机失速喘振工况及端壁边界层流场时所采用的方法,并提供若干典型结果。大量试验表明这些方法行之有效。用三支同型探针,沿周向不等间隔分布,失速喘振
期刊
热线风速仪
轴流压气机
失速
hot wire anemometer
stall
endwall boundary layer
基于RM-ODP的模型复用框架OMRF
基于RM-ODP标准以及Web services技术,提出了基于Web应用的开放的模型复用框架OMRF,从企业视图、信息视图、计算视图、工程视图、技术视图五个层面给出了该框架的主要内容,分析了基于该框架的模型复用开发应用模式,阐述了基于该框架的具体研究问题,对提高模型复用与集成能力具有一定参考价值。
期刊
基于开放的分布式处理参考模型复用框架
模型服务
开放的分布式处理参考模型
WEB服务
model reuse framework based on RM-ODP
基于多基音跟踪的单声道混合语音分离
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。
期刊
计算听觉场景分析
多基音跟踪
语音分离
computational auditory scene analysis(CASA)
multi-pitch trac
与本文相关的学术论文