维吾尔语信息检索

来源 :天津大学 | 被引量 : 0次 | 上传用户:lbfjm78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,科学技术的进步,尤其是计算机技术的推广和运用为维吾尔语的研究和应用创造了良好的人文和科技环境,同时对传统的语言研究提出了许多新的要求。为了维护网络的信息安全,防止有害信息传播,维吾尔语的信息检索是一项重要的工作,在一定程度上起到了加强民族团结、构建和谐社会的作用。而高效、正确的检索出用户所需要的信息,就要准确的对维语切分并提取词干。因此,本文的主要内容围绕维语的词干提取和信息检索两大部分展开,涉及内容如下:1词干提取的数据基础是维吾尔语词库,因此,根据维语构词法的特点,建立了基于Access数据库的维语词缀库和词干库。通过词库管理系统,完善和更新了数据。2维吾尔语的词干提取首先以空格为切分特征标记切分并存储维语单词,然后采用正向与逆向最大匹配结合的双向匹配算法,实现了维语词的切分,从而获得词干及其相关属性信息,并存储结果。3建立强大而完备的背景资料数据库是全面、准确、高效地进行信息检索的最强有力的支撑。在建立背景资料库的基础上,根据空间向量模型算法,实现了待查维语文本的检索。综上所述,本文通过自学习不断完善背景资料库,使得维吾尔语的信息检索更加准确,为今后维吾尔语的研究提供数据支持。
其他文献
多年来视频监控在各类场所的安全保障任务中发挥了巨大作用,其应用范围也在不断扩大,但由于传统人工视频监控存在的成本高、易漏报、准确性低及效率低等问题,具有实时性和主
地源热泵是一种高效、节能、环保的空调技术,面对当前日益严重的能源危机,合理的利用地源热泵技术可以有效解决能源问题。本课题针对某学校两台地源热泵机组的联动运行进行研究
该论文主要研究控制领域中的线性时变系统的状态观测器设计问题,其目的在于经由状态重构解决实际工程中系统状态量由于种种原因无法完全或部分获得的问题。区别于在状态观测
局部不变特征提取与匹配技术是三维重建,数字水印,机器人视觉等计算机视觉领域,特别是图像配准研究方向中不可或缺的基础步骤。由于图像之间广泛存在着旋转,尺度,仿射,以及局
捷联式惯性导航系统在军用和民用领域中应用十分广泛,其中导航系统的精度是衡量一个捷联式惯性导航系统优劣的一个极为重要的性能指标。国内外为此展开一系列的相关误差模型的
目前出现的一些智能控制,之所以能在不依靠系统模型的条件下对复杂系统进行控制,原因在于系统的特征信息,为此,本文提出特征量和特征模型的概念,并以此为思想主线,分析了输入类特征
高速铁路的传统探伤方法占用线路且速率受限,识别效率较低。为了及时掌握钢轨的安全状态,必须研究一种新型、快速的高铁钢轨伤损检测方法。声发射技术指材料在断裂和塑性形变
在过程控制、医药卫生、能源计量及日常生活等领域中,流量是最重要的检测控制信号之一。浮子流量汁是一种经典的变面积式流量计。因其具有构造简单,工作可靠,价格低廉,对前后
网络化系统是由一个用于数据传输的通信网络将在不同地点的执行器组、控制器组、传感器组以及被控对象连接起来而构成的间歇式闭环反馈系统,进而完成系统所要求的控制任务。
电学层析成像(Electrical Tomography,简称ET)技术是近几年快速发展起来的一种检测技术,相比于其他的CT技术而言,其具有非侵入性、便携性、无辐射以及价格低廉等优势,被广泛