WebSonar:基于关键信息的语音搜索引擎

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lbx5000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,世界已走向信息经济时代;信息资源并不稀缺,稀缺的是发现信息资源的手段。而搜索引擎正是因此应运而生,但是现在流行的搜索引擎一般只基于文本信息的搜索,即便针对于语音信息,比如新闻记录,谈话记录等等,它仅仅只能检索一些元信息:作者,标题,描述,文件大小等等,而不能提供基于语音内容的检索。随着互联网上的语音资源越来越多,人们会越来越希望能够搜索语音的内容。针对于这个需求,本论文提出基于关键信息的语音搜索引擎,所谓关键信息就是指语音资源中的说话人或特殊关键词。比如:我们想在互联网上搜索包含“比尔盖茨”这个词的内容的语音资源;或者“比尔盖茨”说的话的录音。本论文利用说话人识别技术搜索关键人物的谈话、演讲等录音;利用关键词识别技术搜索包含关键词的语音资源。本论文的主要内容:第一、提出了一个语音搜索引擎的框架。第二、关键词识别技术、说话人识别技术与搜索引擎技术的融合。第三、搜索引擎在搜索关键人物语音资源的应用。第四、设计了搜索引擎的局部优化技术本文得到以下资助:国家发展改革委员会“CNGI示范工程2005年研究开发、产业化及应用试验项目”(CNGI-04-12-2A)、国家自然科学基金(60273059)、国家杰出青年科学基金(60525202)、教育部“跨世纪优秀人才培养计划”专项基金(NCET-04-0545)、国家自然科学基金重点项目(60533040)。
其他文献
[目的]了解广东省蔬菜地土壤氮磷状况,减少氮素磷素大量流失,指导广东蔬菜地施肥。[方法]对广东部分地区74个地点的施氮量进行调查并测定57个土样土壤中Olsen-P、Mehlich1-P
<正>习近平总书记强调:"人民对美好生活的向往,就是我们的奋斗目标。"这体现了党和政府情系群众,关注民生的为民情怀,也指明了新的历史条件下,党对人民的负责态度和担当。发
随着企业社会竞争压力的不断加剧,想要从各种同类品牌中脱颖而出成为最吸引人注意的一个是每个企业所期望的,我们设定了企业形象识别系统(简称VI),来规范和展示企业在视觉平
文章系统地介绍了支气管哮喘防治药物的进展 ,内容包括 β2 激动药、茶碱、抗胆碱药物、糖皮质激素、肥大细胞稳定药、抗组胺药、抗白三烯类药物、新型抗炎药、免疫抑制药及
藏族部落法将继承分为"身份继承"和"财产继承"。本文主要从直系亲属继承和旁系亲属继承两个方面论述了藏族部落习惯法中有关财产继承方面的内容和特点,提出在民族区域自治地
<正> 川剧弹戏,源于外地,成于本地。本文拟就川剧弹戏的由来及其流变状况,谈一点粗浅的看法。
高校辅导员工作是一个具体实践的过程,也是伴随着情感、理性和经验的过程,关注学生的生命成长且引人向善。辅导员的实践智慧是辅导员在学生工作实践中灵活应对复杂学生工作情
我国制药企业在实施《药品生产质量管理规范》的过程中存在概念不清、不能有效转换操作模式等问题。药品生产企业的质量监督和生产部门应明确过程控制的主体、工序关键控制点