基于网络的说话人识别系统研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zy1848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是个人所固有的特征,具有唯一性,用语音来鉴别说话人的身份也因其独特的优点而日益受到人们的关注。在互连网飞速发展的今天,如果能够将说话人识别技术和网络传输技术有机地结合起来,通过因特网对个人身份进行远程识别(尤其是与文本无关的识别),对于人工智能的发展必将具有极其深远的意义。  本文将基于网络的与文本无关的说话人识别系统作为研究及设计的对象,针对客户端内存容量有限以及网络传输的特点,在Visual C++6.0软件环境下设计出了适合于网络环境的说话人识别系统。该系统采用客户/服务器模式,以Windows Sockets类构建的TCP/IP协议进行网络连接,负责客户端特征序列的传送和服务器端识别结果的回传。在客户端进行特征提取,将传统的线性特征与一种新的非线性特征结合,得到一组数据量小、特征覆盖面高的说话人特征序列;在服务器端进行识别,将隐马尔可夫模型(HMM)与支持向量机(SVM)相结合以满足识别率高、实时性好的系统要求。另外,为了降低数据量、提高系统识别效率,在端点检测和识别方式中还分别采用了改进的对数能量形式和预分类的识别方法。实验结果显示,该系统最终识别率达到了90%以上,具有较好的实用价值。  本文最后给出了研究结论,指出了不足之处及未来的研究方向。
其他文献
藏族人群定居青藏高原距今至少1万年的时间。高原极端环境特别是高海拔低氧是人类唯一无法借助传统手段克服的环境压力。藏族人群与生活在平原地区的人群相比,对高海拔低氧的
作为新一代的城域网技术,弹性分组环(Resilient Packet Ring,RPR)具有结构简单、扩展性好、即插即用、高带宽利用率、严格的Qos保证及小于50ms的快速保护倒换等优点。RPR采用
本文主要研究了Ba0.65Sr0.35TiO3陶瓷的制备工艺和性能。文章通过对不同温度下预烧粉料的XRD分析和陶瓷的电学性能研究,确定了制备BST陶瓷的最佳工艺条件;选用B2O3-SiO2和MgO掺
碳纳米管由于其独特的电学特性及优异的力学、热学性质,在纳米科技的各个领域,尤其在纳米电子器件方面显示出广阔的应用前景。但是在碳纳米管的可控合成、掺杂以及构建不同特性
SiC材料由于具有宽带隙、高临界击穿场强、高热导率、高载流子饱和漂移速率等特点,在高温、高频、大功率、光电子及抗辐射等方面具有巨大的应用前景,许多国家相继投入了大量资
OFP(Ovate Family Proteins)基因最初在番茄中发现,是植物所特有的一类转录因子。番茄,拟南芥和水稻的OFP基因编码的蛋白羧基端均含有一个大约70个氨基酸组成的OVATE结构域。 
有足够的证据表明,长期过量饮酒会造成机体的严重损伤,尤其对于肝脏组织更是如此。肝脏线粒体是酒精代谢的主要场所,也是酒精中毒所直接损伤的亚细胞器。有关酒精生物学的另一个
学位
电吸收调制分布反馈半导体激光器(Electroabsorption-Modulated Difstributed-Feedback Lasers EMLs)是波分复用网络中最有前途的光信号源.这种集成器件具有许多独特的优点,
自上世纪60年代以来,以集成电路为核心的微电子技术迅猛发展,深刻地改变了人们的生产、生活和工作方式,使人类步入了信息时代,而硅作为微电子产业主导材料的地位也逐渐被确立。当
自噬(autophagy)是细胞内的一种“自食”现象,是进化上保守的受到严格调控的溶酶体参与降解自身受损细胞器或细胞质蛋白的过程。这种过程受到多种细胞应激的诱导,包括营养或生