藏文搜索引擎中的分词算法研究

来源 :西藏大学学报 | 被引量 : 0次 | 上传用户:ttw961086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题.对搜集到的藏文网页文本或用户查询关键词进行理解、提取和组织等处理是搜索引擎的一项基础性工作,其中藏文分词的准确与否,直接影响到搜索引擎查询效果及查询结果列表的排序问题,因此分词成为藏文搜索引擎技术中需要解决的关键问题.文章针对藏文搜索引擎中基于字符串匹配的藏文分词技术进行研究并提出相应的解决算法.
其他文献
<正> 1.XJ200型甜菜收获机我国甜菜收获机械化水平较低,使用人工收获费时费力,又不经济。1998年新疆德隆农牧业发展有限公司从芬兰康克公司进口了4台优克公司(JUKO)生产的XJ2
<正> ZB-45型轻便制钵机是由湖北省宜昌市农业机械化研究所研制开发的一种新型制钵机具。该机适用于棉花、玉米、烤烟、蔬菜、瓜果等作物育苗移栽所需营养钵的制作。
随着经济快速发展和人口急剧增长,拉萨市区生活垃圾的产量也在大幅增加。生活垃圾的处理处置能力成为创建拉萨文明城市、卫生城市、环保模范城市的重要考核指标。在考核生活垃圾分类回收资源化的潜在价值方面,生活垃圾自身的组分特征成为重要基础参数。文章对拉萨市区生活垃圾日产量、容重、含水率及组分等物理特性方面进行了分析研究。研究发现,拉萨市区生活垃圾日产量为590t/d,容重达到300kg/ma,含水率为24.38%;垃圾样品物理组分为动物4.74%,植物15.71%(加起来为有机物,占20.45%),灰、渣(无机物)
提高水稻耐盐性是水稻抗逆育种的主要目标之一,利用生物信息学手段,共收集整理来自15个作图群体共263个与水稻耐盐性相关的QTL信息。通过Biomercator2.1和共有标记映射,将QTLs整
本文简要介绍了PCI总线的特点,阐述了Linux下设备驱动程序设计的要点和思想,结合作者开发视频压缩卡驱动程序的实际,讨论了Linux下PCI设备驱动程序的框架,并详细介绍了各个模
<正> 1 彻底清理拖拉机各部位灰尘、泥土和油污等。要注意电子感应器、雷达等元件不能用高压水清洗。 2 将后悬挂装置放到最低位置。 3 卸掉前后轴全部配重。
多年来西藏在中央关心、地方援助的工作机制下实现了经济高速增长,但在传统发展方式的背后也暴露出许多问题,如产业结构缺乏互动,发展内生动力不足,生态资源优势逐步丧失。中
<正> 大中型轮式拖拉机和农用运输车一般都装用振动式电喇叭,它主要由膜片、振动盘、电磁铁、电磁线圈、电容器、触点、膜片中心杆和调整螺母等零件组成,电喇叭的常见故障有
研究三个不同藜豆品种对NaCl胁迫的响应,筛选耐盐能力强的品种。在种子萌发时用不同浓度NaCl溶液胁迫处理,测量发芽率、发芽势、发芽指数、活力指数及子叶期幼苗的生长指标和根
<正> 六、全液压转向器的熄火转向熄火转向与动力转向不同,如前所述,这时是由驾驶员的手做动力,用较大的力扳动转向盘使车辆转向。熄火转向常在发动机不能启动,车辆由另外的