【摘 要】
:
随着智能语音技术和产品应用大规模的成熟落地,对高质量语音数据集的需求与日俱增。目前,针对结构化数据的质量评估方法有一定的研究,但尚未形成面向非结构化的语音数据集质量评估标准。通过研究语音算法模型的构建原理,分析语音数据集的建设需求,建设统一的语音数据集质量评估体系。该评估体系从4个维度对面向算法模型训练的语音数据集进行质量评价,包括广度覆盖性、选集区分性、领域深入性和数据完整性。通过提出具体的语音
论文部分内容阅读
随着智能语音技术和产品应用大规模的成熟落地,对高质量语音数据集的需求与日俱增。目前,针对结构化数据的质量评估方法有一定的研究,但尚未形成面向非结构化的语音数据集质量评估标准。通过研究语音算法模型的构建原理,分析语音数据集的建设需求,建设统一的语音数据集质量评估体系。该评估体系从4个维度对面向算法模型训练的语音数据集进行质量评价,包括广度覆盖性、选集区分性、领域深入性和数据完整性。通过提出具体的语音数据集质量评估指标、计算方法和评估步骤等,对车载应用领域语音数据集的质量进行评估并对结果进行分析,对评估语音数据集质量、促进数据集建设提供参考。考虑了语音数据集构建的多样化适用能力、隐私问题、效率要求、自动化需求等,提出了构建高质量的语音数据集的未来发展建议。
其他文献
目的:探讨儿童多重耐药肺炎克雷伯菌(MR-KPN)感染的独立危险因素,为其治疗及防控提供循证依据。方法:回顾性分析暨南大学附属东莞医院2017-2020年收治的124例肺炎克雷伯菌(KPN)感染患儿临床资料,根据是否发生多重耐药分为MR-KPN组43例和KPN组81例。通过单因素分析筛选MR-KPN感染的危险因素,二元Logistic回归分析独立危险因素。结果:两组标本来源均以痰液为主。患儿年龄、
阐述人工智能与互联网的应用,包括人工智能与互联网相结合的办法进行网络管理、人工智能提高计算机网络安全系数、加强计算机系统管理评价。
本研究通过对郴州市部分居民开展问卷调查,采用Logistic回归模型对居民参与社区教育意愿的影响因素进行实证研究。结果表明:在个体特征中,性别和文化程度对居民参与社区教育意愿的影响显著,女性居民参与社区教育的意愿比男性更强,居民的文化程度越低,参与社区教育的意愿越强。在认知特征中,居民对于开展社区教育活动必要性的认知以及参与社区教育活动的频率对居民参与社区教育的意愿有显著正向影响。在社区特征中,社
中医古籍是中国传世古籍的重要组成部分,是中医药传统文化传承和发展的基础。文章介绍了河南中医药大学图书馆古籍馆藏情况,指出了保护和利用古籍面临的问题及解决路径,旨在为相关研究提供参考。
在乡村振兴背景下,改善乡村人居环境、建设美丽乡村得到了前所未有的重视。乡村环境质量不仅关乎乡村居民的生活水平,还影响着乡村下一代儿童的成长与发展。本文以乡村儿童为研究对象,以乡村儿童户外活动偏好为研究角度,基于儿童立场,旨在建立更大程度意义上的人性化视角,在乡村环境层面,探索改善乡村儿童户外活动体验的环境优化路径和策略。本文研究包括以下4个方面:(1)基于我国的乡村背景,分析了我国乡村儿童与乡村环
通过对60余年来中医图书联合目录编纂工作的回顾与经验总结,提出中医古籍“联合编目思想”的概念,梳理中医古籍联合编目建立组织、拟定计划、收集整理、汇总校对的四个步骤和调研方式与范围、编目规则与方法、工作机制三个方面的内容,并结合具体实践与应用实例,分别阐述联合编目思想彰显学术学科布局、揭示文献发展规律、反映书籍版本传承的学术功用与促进古籍事业发展、指引古籍购置收藏、指导古籍发掘利用的应用价值。联合编
目的:探索中医药治疗强直性脊柱炎领域的发展概况、研究热点及趋势。方法:检索中国知网(CNKI)自建库至2021年9月30日收录的中医药治疗强直性脊柱炎的相关文献,运用CiteSpace可视化软件,对文献的作者、机构、关键词进行知识图谱分析。结果:共检索出有效文献2326篇,作者723人,冯兴华等43人被引频次≥10;研究机构492所,中日友好医院等36所机构被引频次≥10;纳入关键词676个,频次
农村产业融合发展是推动产业兴旺的重要抓手,是促进农户长效增收的有效途径。农户的积极参与对农村产业融合发展具有十分重要的意义。随着城镇化与工业化的发展,乡村空间上出现土地利用低效、用地布局无序、生态环境退化等问题,而全域土地综合整治的实施可以为农村产业融合提供发展用地和配套设施。基于此背景,本文以湖北省宜都市枝城镇为研究区域,以农户为访谈对象,运用选择实验法进行问卷设计,通过实地调研获取所需数据,构
目的 收集中医药在缓慢性心律失常研究领域的科研文献数据,进行文献计量学分析,梳理该领域的整体研究脉络、发展现状、热点方向及未来趋势。方法 检索科研数据库(CNKI、PubMed)中的文献信息,获取相关数据后使用信息可视化软件CiteSpace及VOSviewer分别对纳入数据进行年度发文趋势、研究热点可视化,作者与机构合作网络等文献计量学分析,生成知识图谱。结果 本研究共纳入文献2691篇,包括主