基于关键词的维吾尔单文档自动文摘技术研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lhxsst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以互联网为代表的信息技术的发展使人们索取信息变得前所未有的便捷,同时也对如何有效利用信息提出了挑战。自动文摘技术通过自动选择文档中的代表句子,可以极大提高信息使用的效率。近年来,基于英文和中文的自动文摘技术获得广泛关注并取得长足进展,而对少数民族语言的自动文摘研究还不够充分,例如维吾尔语。构造了一个面向维吾尔语的自动文摘系统。首先利用维吾尔语的语言学知识对文档进行预处理,之后对文档进行了关键词提取,利用这些关键词进行了抽取式自动文摘。比较了基于TF-IDF和基于Text Rank的两种关键词提取算法,证明Text Rank方法提取出的关键词更适合自动文摘应用。通过研究证明了在充分考虑到维吾尔语语言信息的前提下,基于关键词的自动文摘方法可以取得让人满意的效果。
其他文献
通过借鉴英美及奥地利监管科技的应用经验,本文认为可从四方面推进监管科技在第三方支付监管中的应用,一是要借鉴“监管沙盒”模型,积极培育监管科技企业;二是要积极推动建立
主要目的研究决策信息为Pythagorean模糊数,决策属性间存在相互关联的多属性群决策问题。首先,基于Pythagorean模糊数运算和Choquet积分,提出了诱导型广义Pythagorean模糊Cho
农民环境维权面临维权意识淡薄、维权成本高、相关体制不健全及农民对自然资源的依赖性制约其环境维权等问题。应从加强农民环境维权教育、健全法律援助体系、完善相关制度建
集群互助担保模式是解决中小企业融资难的重要模式.通过系统分析中小企业互助担保风险评估特征,设计评估系统指标体系,然后重点运用模糊隶属函数和模糊集理论与方法,可解决中
目的:分析南京军区"医云工程"建设现状,展望"医云工程"未来。方法:调查分析南京军区"医云工程"目前开展情况,研究其存在的主要问题和发展愿景。结果:各医院按照军区部署要求,
<正> 内田和汉药公司是一个较大的和汉药批发商,该公司经营批发日本产的以及中国等地产的中药材。公司设在东京,其批发业务在东京、大阪、九州等地营业所。另有一生产厂为大
针对蔬菜中吡虫啉残留分析没有国标可执行的问题,着手对此进行了一些研究,提出了一种简单、快速且较为经济的对残留量的检测分析方法。用二氯甲烷,采用匀浆法提取,并用安捷伦的C1
本文探讨时装品牌设计与策划体系的基本特点、基本内容和运作过程,提出时装设计应始终以市场为出发点和归缩,树立品牌意识,以市场为导向,情报分析为依据,开拓具有中国特色的时装品
本文介绍了对一个正态总体进行方差检验的原理、方法和步骤,简介了它的数学基础x2分布,阐述了显著性水平α的意义,分析了两类错误,给出了应用实例.
湘鄂渝黔边民族地区高等职业教育的定位应该是“以坚持服务地方社会经济为目标,以就业为导向,培养面向地方生产、管理、服务一线的实用性、技能型高级人才";必须确立"围绕产业