基于遗传算法的聚类方法对EBF网络的优化及其应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:holyturtle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是模式识别的一种,它用语音信号和预先提取的说话人特征作为生物特征,确定或鉴别说话人的身份,符合当今信息化时代对身份验证的需求.人们已经认识到,语音信号中存在着非线性性质,而神经网络技术具有任意非线性逼近能力,自然成为话者识别研究中的一个重要方法.从模式识别角度看,目前国际上绝大多数的研究都集中在各种神经网络方法上,特别像具有分类特征的径向基核函数(RBF)神经网络.RBF神经网络中隐层的训练过程属于一个聚类过程,聚类的好坏直接影响了神经网络的执行效果,目前基于目标函数的模糊K-均值算法(FKM)是应用最广泛的模糊聚类算法.本文提出了一种先进的聚类算法--基于两级自适应遗传算法(MTLAGA)的聚类方法,试图同时解决模糊K-均值算法对中心点数目以及初始中心位置敏感的两大问题.针对说话人特征的复杂分布,提出了扩展的RBF神经网络--椭圆基核函数(EBF)神经网络,充分利用EBF网络的全协方差矩阵对复杂分布的表征能力,并将MTLAGA聚类算法作为EBF神经网络隐层参数的确定方法,形成本文话者确认的方法.本文通过文本独立的话者确认实验,证实了采用MTLAGA聚类算法的EBF神经网络大大提高了说话人识别率.相比较采用FKM聚类算法的EBF神经网络,基于MTLAGA聚类算法的EBF神经网络获得了更高的识别率,证明针对复杂分布的说话人特征的聚类,即使在已知聚类中心点数目的情况下,不恰当的初始中心易使FKM算法陷入局部极小点,而MTLAGA聚类算法利用遗传算法全局优化的特点,克服了FKM算法的这种缺陷.另外,将基于RBF神经网络的说话人确认与基于EBF神经网络的说话人确认进行比较,发现全协方差矩阵对复杂分布的样本表征能力更强,识别率更高.与一种统一聚类中心的算法相比,本文提出的算法不仅获得了比前者更高的识别率,同时得到更大的分辨阈值,说明不同话者说话特征不尽相同,不应采用统一的聚类中心方法.
其他文献
学位
本文以自动化综合性先进控制实验系统建设为研究背景,提出基于PROFIBUS总线的控制方案,构建了先进控制实验系统,并实现了先进控制实验系统的网络化。围绕这个课题,重点深入研究了
本文基于DTS的算法解码标准[6],详细地论述了DTS的编解码原理,特别是对DTS的编码原理中的子带编码、全局比特分配、子带自适应差分PCM编码、声道耦合等进行了详细的阐述。在掌
现场总线技术是上世纪80年代末发展起来的一种新的工业控制底层网络,已经成为控制网络的典型实现模式.基金会现场总线(FF)是IEC61158现场总线标准中的一员,主要用于仪表行业.
文本以及基于内容二个不同的角度,对图像检索作了研究。另外多媒体内容描述标准MPEG-7也正在制定当中。基于文本的图像检索,其研究主要在数据库领域中进行,图像检索的一个典型框
多目标优化问题通常难以处理,80年代中期以来人工智能的进化算法开始应用于该问题,并形成了最近的一个热门研究领域.对多目标进化算法的研究也是近年来求解多目标优化问题的
该文在对现有人脸检测与跟踪方法进行详细综述的基础上,提出了基于曲线进化的人脸检测与跟踪方法,即以人脸轮廓作为描述人脸的主要特征,充分利用曲线进化方法可以建模和提取
连铸二冷区是指从连铸机结晶器出口到拉矫机的长度内设置的一个喷水冷却区.铸坯从结晶器出来后,内部还是液心,需要在二冷区继续冷却,使铸坯完全凝固,二次冷却的好坏直接影响
钢铁企业通常将不同热值的煤气混合以后加压再送往各生产单位。混合加压后煤气的热值与压力的稳定与否,是影响轧钢单位正常生产的最重要的因素之一。 煤气混合加压过程的控
在现代工业生产中,大量变流装置的应用,给电网注入了大量的无功功率和谐波,造成电能质量严重下降。为了保证电网和用电设备的正常运行,消除谐波污染变得尤为重要。三相电压型可逆变流器具有谐波含量低,可单位功率因数运行等优点,能够从源头上消除谐波,可用于解决电网谐波污染。首先,本文在三相静止abc坐标系和同步旋转dq坐标系下,分别建立了三相电压型可逆变流器的通用数学模型和dq模型,并提出了一种空间矢量脉宽调