基于维吾尔文的聚焦策略爬虫技术研究

来源 :新疆师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:sqno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络资源的不断丰富,人们获取信息的途径已被网络代替。维吾尔文,在语言信息处理,WEB应用等领域有了迅速的发展。文章针对网络爬虫的工作原理以及聚焦爬虫策略进行阐述,在此基础上结合维吾尔语信息提取的相关研究,研究了维吾尔文的网络爬虫技术的结构和策略,从而为维吾尔文搜索引擎的网页数据库建设和维吾尔文网络舆情分析研究提供海量的语料。 With the continuous enrichment of network resources, people have been replaced by the Internet access to information. Uyghur, in the language of information processing, WEB applications and other areas have been rapid development. Based on the related research of Uyghur language information extraction, this paper studies the structure and strategy of Web crawler in Uyghur language so as to build a Web page database for Uyghur search engine And Uighur online public opinion analysis provides a wealth of corpus.
其他文献
随着流量计的广泛使用,准确的流量计量,不仅是石化企业贸易结算的依据,也是关系到生产全过程是否安全受控的重要保障。本文简要叙述涡街流量计原理及主要检定项目,通过对日常
本文通过阐述电气工程在建筑工程中的重要作用,谈到电气工程师应具有的责任心及工作能力,以及在建筑工程中应注意的问题,特别是在工程的质量、技术措施等方面应注意的问题以
如今,科学技术的迅猛发展使世界发生了翻天覆地的变化,作为应用科学基础的数学,在21世纪也得到发展,数学的广泛应用性得到了充分体现.在“科教兴国”基本国策和实施素质教育
潜在蒸散量是评价区域干湿状况和估算作物需水量的关键因子.本文以阿克苏地区6个国家级气象站点近60a的逐日气象资料为基础,应用Penman-Monteith公式计算各站点多年的潜在蒸
现阶段,我国提高了对于干休所服务保障方面的经费投入,怎样将经费用好,促进使用效率的提升,对有关财务工作者提出了更高的要求.干休所当中的财务工作者需以干休所任务作为基
期刊
随着我国经济的不断发展,企业之间的竞争也在日益增大,成本的控制在房地产企业中占据着非常重要的地位,本文主要阐述了建立内部控制制度在房地产的企业成本控制方面的重要意义以
1、高效课堂是指教师在遵循教学活动的客观规律下,以尽可能少的时间、精力和物力投入,取得尽可能多的教学效果,以满足社会和个人的教育价值需求而组织实施的活动.运用问题教
父亲节的时候,我想起了父亲戴草帽的样子。父亲干农活时总要戴一顶草帽,戴上了草帽父亲就成了侍弄庄稼的把式。  父亲的确是一个干农活的好把式,碾麦扬场、套牛犁地、施肥锄草、耙地摇耧,样样农活都干得很认真。他曾说过,人哄地一阵子,地哄人一季子!庄稼人就要把庄稼务得十里八乡数一数二的才算是个庄稼人。村子方圆几里的人都知道父亲务庄稼是行家。  参加高考的那年,我陪父亲拉着麦子到县城交公粮。大清早的太阳已经发
期刊
目前部分油田已开始进行聚合物驱油,而聚合物浓度是一项重要指标,准确测定聚合物浓度对保证聚驱效果有重要的作用。目前油田上检测聚合物浓度的方法主要为浊度法和淀粉——碘
随着中央不断加大保障房建设力度和扩大保障房覆盖范围,中央对房地产市场宏观调控重要举措之一的保障房建设工程,作为一项重大的民生工程而被社会各界广泛关注。但近年来,不乏公