【摘 要】
:
维文本体知识库是维文语义信息处理的基础,而维吾尔文本体概念的抽取是维文本体知识库构建的重要基础性工作之一。如何根据维吾尔文的语法、句法特征,抽取出维文本体概念是值得
论文部分内容阅读
维文本体知识库是维文语义信息处理的基础,而维吾尔文本体概念的抽取是维文本体知识库构建的重要基础性工作之一。如何根据维吾尔文的语法、句法特征,抽取出维文本体概念是值得研究的一个方向。目前已提出了一些单一方法或静态权值的多策略融合方法,抽取正确率达到了一定程度,但面对实际应用中多种类型的语料,其抽取结果不能满足实际应用的需求。存在的主要问题如下:第一,现有方法的规则模板的覆盖率不高,因此直接导致对多字词识别的精度不高;第二,由于没有考虑方法本身所考虑的特征类型以及所处理的语料类型,因此静态权值的多策略加权方法在处理不同语料时不能真正发挥各方法优点,从而无法真实体现概念的领域归属度;另外,经过查新,尚未见到维吾尔文本体概念抽取方法的研究报导。如果将现有方法应用于维吾尔文概念抽取,需要进行相应的调整和处理。为解决以上问题,本文提出一种基于动态权值的多策略维文本体概念自动抽取方法。该方法采用自动学习的维吾尔文规则学习模式,对经过词干提取及词性标注处理的熟语料进行匹配,筛选出候选概念,然后综合考虑改进的DR&DC、TF-IDF和NC-Value三种策略的涵盖特征以及方法对语料的处理能力,将三种策略动态加权融合后量化维吾尔文候选概念的领域归属度,领域权重超过阈值的概念存入维吾尔文本体概念集合。最后,通过300篇计算机领域的维吾尔文语料(其中科技文献100篇,自由文本200篇)进行实验,其概念的抽取准确率达到了89.7%。
其他文献
本文运用调查、访谈和文献资料等方法,对河南高校足球专修课教学现状进行调查研究.分析足球专修课教学存在的问题并提出对策,为课程改革提供依据,旨在促进素质教育在高校的实
计算能力是学生学习数学所必备的基本能力,是学习数学的基础,更是贯穿于小学数学学习的全过程。可见提升学生的计算能力是提高数学学习质量的保证,也是小学数学教学的一项主要任
由于我国现有的大量中小型水库都不同程度的存在病险问题,针对病险水库开展除险加固改造,对确保防洪安全,充分发挥水库的经济、生态和社会效益,为经济发展提供水利保障,具有
城市电视台是我国电视事业和产业的有机组成部分,在促进和推动城市文化建设和经济发展的进程中发挥了重要作用,但随着文化体制改革的推进、媒介的融合和竞争的加剧,城市电视
休闲作为一种亚文化形态,在传承民族文化,塑造人的价值观,提升人的品格教养等方面始终发挥着重要作用。然而,遗憾的是,传统休闲价值在近现代几次大的社会转型中被肢解得愈来
<正> 第一场[焦廷贵内声:“二哥!”[孟怀源内声:“贤弟!”[焦廷贵内声:“催马!”[“急急风”。焦廷贵、孟怀源“趟马”上。孟怀源(唱“西皮散板”) 王文无故来犯境。焦廷贵(
认知科学的研究成果为研究口译过程开辟了新的道路。在Gile提出的交替传译和同声传译脑力分配模式的理论基础上,分析了口译中精力分配失衡的原因,探讨了如何通过降低口译各项
2006年5月21日,一场别开生面的婚礼在安徽省滁州市城郊乡举行。新郎叫马一波,滁州城效乡人;新娘叫邓嘉慧,是上海一个知识分子家庭的千金。农村打工仔娶了上海姑娘!这条消息像
为了应对严重的贫困问题,我国政府采取了一系列政策,但由于贫困者自身资源发掘不够,效果不理想。2004年长沙部分社区从提升低保户自身社会资本的角度,尝试用社会工作理论和方
从20世纪80年代开始至今,民办院校在数量和办学规模上在不断发展壮大,至2011年为止,民办高校数量占全国高校数量29%,民办高校学生占高校总人数的17%。这些还在不断增长的数字