基于子词链的中文新闻广播故事自动分割

来源 :计算机应用研究 | 被引量 : 6次 | 上传用户:hbh0429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解决了在传统词链方法中由于语音识别错误(特别是词典未收录词汇)导致的相关联词之间无法匹配的问题。同时,利用各级词汇表示单元之间的互补性,如词的表义确定性和子词对语音识别错误的鲁棒性,对各级词汇进行融合,利用不同级别词汇表示单元的优势进一步提高中文新闻广播故事分割的性能。在TDT2中文标
其他文献
从生态系统管理研究中多主体模型的引入、生态系统管理研究中多主体模型的发展、生态系统管理中多主体系统的计算机建模等三个方面对多主体模型在生态系统管理中的国外研究进展进行了回顾。对生态系统管理中多主体模型的应用进行讨论并提出多主体模型在个体决策、模型规则和层级理论等各方面的研究前景,期望为国内生态系统管理研究提供新的思路和方法。
1临床资料 42例患者均为门诊患者,男25例,女17例,年龄17~60岁。参照《中医病证诊断疗效标准》诊断。以鼻塞伴有前额闷痛为主症,经耳鼻喉科检查,鼻黏膜暗红、肿胀,中鼻甲肥大。经X射
1实验材料 1.1实验动物SD大鼠40只,雌雄不拘,体重(180±20)g,由上海中医药大学动物实验中心提供。1.2中药补肺益寿合剂I号制备 补肺益寿合剂I号由山药、熟地、仙茅、巴戟天、
为了提高进化策略的搜索精度和全局搜索能力,提出了一种基于反馈和混沌变异的改进进化策略,将各代当前最优搜索结果反馈到变异步长的更新公式中,通过对变异算子中随机数方差的调整使进化策略的变异步长随搜索过程自适应地变化,同时根据混沌运动具有遍历性的特点,利用混沌变异产生个体,保证种群中的部分个体在搜索后期仍保持较大的跳出局部极小的能力,从而达到提高算法全局搜索能力和搜索精度。为了对比改进后进化策略与常规进
目的:探讨肾毒宁冲剂对5/6肾切除大鼠肾脏保护作用的机制。方法:取清洁级SD雄性大鼠30只,通过5/6肾切除法制造慢性肾功能衰竭(CPF)动物模型,术后2周根据血肌酐值分为模型组、尿毒清组
现有垃圾短信过滤系统主要采用对短信进行逐条分析判断的技术,因此处理的效率比较低。针对这一过滤技术的不足,提出了一个基于抽样的垃圾短信过滤方法,该方法引入用户信任度的概念,根据用户的信任度对用户发送的短信进行抽样过滤,极大地提高了处理效率。同时该方法整合了多项垃圾短信过滤技术(黑白名
中医体质是一种客观存在的生命现象,是个体生命过程中,在先天遗传和后天获得的基础上,表现出的形态结构、生理机能以及心理状态等方面综合的、相对稳定的特质。这种特质决定
期刊
1临床资料 1.1一般资料所有病例均来自我院2006-03-2007-02住院病人,共78例,随机分为治疗组40例,其中男14例,女26例,年龄19-72岁,平均55岁;初次发病22例,反复发作14例;病程2-5年不等,本
针对目前客户流失预测方法的不足,在利用训练样本中不同类个数比值来确定各类惩罚参数的基础上,改进标准的C-支持向量分类机(SVC)。通过以美国某电信公司客户流失预测为实例,与标准C-SVC、人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现该方法能获得较好的正确率、命中率、覆盖率和提升系数,是研究客户流失预测问题的有效方法。
针对差异演化算法存在早熟收敛和后期求解效率低的缺点,提出一种新型差异演化算法。该算法基于单种群,在演化过程中直接对当前种群进行变异、交叉和选择操作,无须差异演化算法中的中间过渡种群。此外,新型差异演化算法的变异与交叉概率是时变的,其中变异概率随着迭代次数的增加而减小;交叉概率随着迭代次数的增加而增加。对几个典型的测试函数进行仿真实验表明,该算法能够有效避免早熟收敛,改善了差异演化算法的优化性能。