【摘 要】
:
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入
【基金项目】
:
国家自然科学基金(No.51875454),陕西省自然科学基础研究规划(No.2017JM5048)
论文部分内容阅读
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入基于多领域特异性的新词识别技术,并改进了原有算法的文本分词、词语过滤和特征计算方法,提出了一种改进的TAKE算法,并应用于中文文本关键短语挖掘中。与多种传统关键短语提取算法的对比实验结果表明,该算法提取的精确率、召回率和F值指标的量化结果相比于传统算法有比较明显的提升。
其他文献
为了解胶州市城区小学生目前营养状况,为今后指导学校卫生工作提供理论依据。我们对2006年9月由胶州市疾病控制中心体检的小学在校生体检资料进行分析。
越来越多的研究证实,肿瘤的生物学本质是一种代谢性疾病,基于肿瘤代谢靶点的代谢调节治疗因此成为肿瘤治疗的新方向。肿瘤代谢调节治疗的手段很多,如药物、手术、运动及营养
通过对高校女生毽球选项课教学的分组实验研究,探讨双侧性迁移理论在毽球基本技术教学中的应用效果。研究发现在毽球基本技术的学习过程中弱势脚向强势脚迁移的效果要好于强势
目的:以利培酮为对照,探讨奎硫平治疗精神分裂症的疗效和不良反应。方法:将60例符合CCMD-3诊断标准的精神分裂症病人随机分为两组.分别用奎硫平和利培酮治疗8周,采用阳性症状和阴
目的:探讨病残儿疾病种类、发病原因,以减少病残儿童的发生率。方法:按照国家计生委颁布的病残儿医学鉴定诊断标准及其父母再生育指导原则。对重庆市10个区县申请医学鉴定的922
随着二维超声心动图的普及及广泛采用放射免疫法测定体内微量甲状腺激素,原发性甲状腺功能减退性心包积液的临床报道也增多,现将本院1998年1月~2004年10月诊治的12例该病分析如
通过工程实例,阐述了公园绿化构思与理念,从中分析了公园绿化工程植物设计原则,并提出了城市绿化工程中植物配置的方法,旨在通过合理科学的植物配置,创造出符合当地居民的公
蒙汉翻译属于低资源语言的翻译,面临着平行语料资源稀缺的困难,为了缓解平行语料数据稀缺和词汇表受限引发的翻译正确率低的问题,利用动态的数据预训练方法ELMo(Embeddings f