新闻广播语音自动摘要技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yu830329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今存在着大量丰富的语音信息,需要对其进行有效地利用和开发。语音文档自动摘要就是能满足这种需要的一项很实用的技术,它能方便人们对于信息的检索、浏览以及记录等应用。如何才能从语音文件中提取出重要的词句,并且能够代表文章主题的内容,这是语音文档自动摘要所要思考的问题。本文研究的主要目的就是要深入分析各种摘要技术,寻求与文章主题更为相关的各类特征,探寻更加有效的主题摘要方法。本文首先分析了目前常用的各种摘要技术在语音文档自动摘要应用中的作用,然后通过分析摘要过程中采用的各类统计特征和韵律特征,最终提出了词频、倒排文档频率、基频、平均功率等几种比较可靠的统计特征和韵律特征。为了体现统计特征对语音摘要的识别能力,本文提出了将大词表语音识别器和基于潜在语义分析模型的文本摘要技术结合起来的摘要方法,并在实验结果测试中取得了较为满意的结果。此外,还尝试从基频曲线出发,抽取韵律短语,利用回归直线抽取摘要单元,分析单元间的依存关系,最后采用三种不同的方法选取摘要单元,形成最终的摘要结果,并在实验结果测试中取得了初步的成果。
其他文献
随着卫星通信技术和Internet的迅猛发展,近些年来,人们对使用卫星通信系统传输IP数据,将卫星通信系统融入Internet表现出了极大的兴趣。为了提供高吞吐量和良好QoS保障的IP传
在深入研究图像处理技术的基础上,设计了收购管理信息系统。该系统涉及数字图像处理、计算机网络和人工智能等多门学科技术。本文只对系统难点——车牌识别作详细阐述,并对车
随着教育事业和Internet技术的发展与普及,考试作为衡量人能力的重要手段,在现代生活中的地位进一步提高。各种考试类型不断增加、考试要求不断提高,使得传统的考试方式已经不能
页面置换算法是操作系统请求页式存储管理中的一个重要组成部分。LRU算法是页面置换的一般策略,被广泛用于Windows,Unix,Linux等多种操作系统。但LRU算法在某些情况下会产生
计算机技术发展至今,软件模拟是评估硬件设计、开发系统软件和研究计算机体系结构的有力工具。本论文对LX-1164微处理器体系结构特点、指令集、存储体系进行了详细分析,深入研
软件复用是软件业界为解决日益严重的“软件危机”和日趋复杂的软件需求而提出的一种对策。软件复用技术随着面向对象技术和分布式对象技术的应用而得到迅猛的发展,在当前的软
外部总线与外设接口作为嵌入式系统的重要组成部分,对整个系统的功能有着十分重要的影响。传统的外部总线与外设接口存在占用资源多、设备接入量少、不支持热插拔等缺点,在嵌入
进化算法是一种人工智能技术,该算法主要是通过模拟生物自然选择与进化过程来求解问题,它是建立在达尔文的进化论思想的基础上。因其具有很高的鲁棒性,使其在求解高度复杂的
仿真测试平台是支持嵌入式系统开发的一种有效工具,能够实现产品的软硬件并行开发、协同验证,达到加快产品上市时间、降低开发成本,减少开发风险等目的。 本文选题来源于8
随着信息网络技术的不断发展,人类在享受互联网技术的同时,也在日益受到来自互联网的安全威胁。特别是政府、企业、科研等单位和组织对信息网络系统的依赖程度逐渐增强,面临来自