藏文网页相关硕士博士期刊学术论文

藏文网页相关论文

基于藏文网页的网络舆情监控系统研究

随着互联网和藏文信息化的快速发展,藏文网页中出现了一些反动、迷信内容影响着舆情安全,亟需建立针对藏文网页的舆情自动实时的监......

会议

计算机网络网络安全藏文网页舆情监控

Heritrix网页抓取器的分析与扩展

　　本文利用Heritrix开源和组件特性，讨论藏文网页的抓取问题。首先介绍了Heritrix网络爬虫的体系架构，然后开发了网页抓取扩展的算......

会议

网页抓取器网络爬虫体系架构藏文网页组件问题讨论算法

藏文网页采集技术研究

本文通过分析目前存在的网页采集程序的构造模式,设计了的藏文网页采集模块TibetSpider.提出了采集的藏文网页在数据库中的存储模......

会议

藏文网页网页采集信息抽取网页资源库

XML在藏文网页检索系统的研究

网站是互联网上信息交流的载体,其检索功能是一项很重要的网站性能指标.本文将藏文网页上的检索与XML文档独特结构结合在一起,加速......

会议

藏文网页信息交流网站少数民族文化检索功能性能指标性能提高独特结构互联网载体文档

基于XML的汉藏网页转换

本文主要介绍基于XML实现汉文网页转换为藏文网页的主要思想和实现的主要方法:提出了转换的主要框架,以及产生基于XML的XLIFF中间......

会议

汉文网页转换主要方法藏族地区藏文网页信息思想框架格式翻译传播

藏文网页摘要自动生成系统的研究

随着互联网时代的发展，如何有效地组织和分析藏文信息，提高藏文信息领域获取信息的效率，成为满足藏文信息领域人们需求的关键问题，这使......

学位

网络服务藏文网页自动分词数理语言学

藏文网页抓取及编码统一转换的系统研究

藏文文本资源的收集对藏语信息处理研究有着至关重要的作用．文章在分析国内外藏文网页主要编码方式的基础上，提出了藏文网页的编码识......

期刊

藏文网页抓取编码识别编码转换

基于Unicode的藏文网页搜索探讨

藏文网页搜索是藏文计算机技术和藏文网站发展的必然要求,藏文字的特殊结构和藏文编码的多样性给网页的统一检索造成一定的困难,使......

期刊

藏文网页网页搜索字符编码 UNICODE Tibetan web web search character encoding Unicode

领域本体的藏文主题爬虫搜索策略研究

针对目前没有通用藏文搜索引擎的情况,提出一种基于领域本体的面向主题的藏文信息爬取策略。策略首先根据藏文和藏文编码的特点,判......

期刊

本体相似度计算藏文网页主题发现 Ontology Similarity calculation Tibetan webpage Topic discove

结合语义知识的藏文网页主题句抽取算法研究

通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏......

期刊

藏文网页语义信息主题句抽取 Tibetan Web Semantic Information Topic Sentence Extraction

藏文网页主题爬虫系统的实现

随着藏文信息技术的发展,互联网上的藏文信息呈爆炸式增长,无疑变成了最密集最丰富的网络信息资源,通用搜索引擎的功能无法满足一......

期刊

贝叶斯分类器藏文主题爬虫藏文分词藏文网页

基于文档摘要的藏文网页消重研究

网页消重一方面能解决互联网上存在的信息冗余问题,另一方面能减轻用户的浏览负担,对提高搜索引擎工作效率起着至关重要的作用。藏......

期刊

自动摘要藏文网页信息指纹相似度

语义词库关联的藏文Web语义检索系统研究与实现

文章依据所抓取的大量藏文网页URL,对相关的藏文信息网页进行除噪去重处理,得到较为完善的藏文信息库。对用户要查询的藏文信息进......

期刊

藏文网页信息库藏文语义相关藏文语义扩展 Tibetan web page information library Tibetan semantic rel

基于DIV标签分段的藏文网页正文提取研究

文章针对藏文电子文献资源匮乏、文本资源不规整、收集困难等问题,提出了基于DIV标签分段的藏文网页正文提取算法,该算法将原始网......

期刊

藏文网页分段正文信息 DIV元素标签 Tibetan webpage paragraphing main body text information DI

消除重复藏文网页的完整解决方案

消除重复网页是搜索引擎不可或缺的一部分，藏文搜索引擎也是如此。从信息处理的角度而言，藏文属于“复杂文字”的范畴，其编码在实际使......

期刊

消除重复藏文网页统一藏文编码 Shingle算法

基于藏文搜索引擎的藏文网页消重研究

互联网发展到现在,由于其开放式和共享式等特点,一方面方便快捷地给人们提供了大量的信息资源,大大方便了人们获取信息的效率。但......

学位

藏文网页文本分块特征选取信息指纹相似度计算

基于web的藏文文本自动分类研究与实现

随着互联网的普及和藏文信息技术的发展，藏文网站的数量越来越多，藏文信息资源从匮乏的时代过渡到极为丰富的藏文数字化时代。但面对......

学位

藏文网页自动分类藏文分词特征提取分类算法

基于XML文档的藏文网页倒排索引的研究与实现

如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道，倒排索引又是搜索引擎的核心技术之一，倒排索引直......

期刊

XML 藏文网页倒排索引

看过本文同时还关注