基于DOM修剪的藏文Web信息提取

来源 :计算机工程 | 被引量 : 0次 | 上传用户：longsir8481

【摘要】

：

随着互联网的普及和藏文信息技术的不断发展，出现了大量的藏文网站。该文根据藏文“音节点”的特征识别藏文网页并进行抓取。在建立DOM树的基础上，分析网页的链接、非链接文本

【作者】

：

珠杰欧珠格桑多吉

【机构】

：

西藏大学计算机科学与技术系

【出处】

：

计算机工程

【发表日期】

：

2008年24期

【关键词】

：

音节点 DOM树藏文 WEB信息提取 syllable dot DOM tree Tibetan Web information extraction

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的普及和藏文信息技术的不断发展，出现了大量的藏文网站。该文根据藏文“音节点”的特征识别藏文网页并进行抓取。在建立DOM树的基础上，分析网页的链接、非链接文本与主题信息块之间的相关度。通过语义修剪算法提取藏文主题信息。经测试证实，该算法在藏文网页识别和藏文主题信息提取中具有较好的适应性。

其他文献

教到老学到老

期刊

人民教师教师进修学校课堂气氛学生思想课外读物人生之路双城市日光照射小昆虫识字课

移动速度与速度耐力对立统一的辩证关系探析——以男子800m跑项目为例

运用对立统一的辩证法原理,深入探索我国与世界男子800 m跑优秀运动员在速度与速度耐力训练理念存在的差异,这种理念方面的差异是导致我国与世界男子800m跑运动员竞技水平的

期刊

对立统一原理男子中跑速度与速度耐力关系

加入WTO对我国外汇储备适度规模的影响分析

国际储备的多寡是一国经济实力的重要标志之一，其中外汇储备是国际储备的主体，因而对国际储备的研究大多集中在外汇储备方面。多年来，国内外对外汇储备适度规模问题从理论和实证

学位

WTO外汇储备马歇尔－勒纳条件国际收支平衡

法学教学方法的问题与完善途径——以案例教学为例

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

法学教学教学问题完善途径

Wind-Solar Hybrid Electrical Power Production to Support National Grid: Case Study - Jordan

The paper presents the next generation of power energy systems using solar- and wind-energy systems for the country of Jordan. Presently with the oil prices are

期刊

SOLARENERGYWINDENERGYhybridENERGYsystemsolar energywind energyhybrid ener

乡村绿色发展应妥善处理好六种关系

习近平总书记强调，绿水青山就是金山银山。推进乡村绿色发展，是贯彻新发展理念，实施乡村振兴战略，促进农村农业高质量发展的重要举措。推进乡村绿色发展，需要在价值导向、调控机制

报纸

我国上市公司并购分析与绩效评价

企业兼并与收购是一个企业通过产权交易取得其他企业部分或全部控制权，以增强自身经济实力，实现自身长远目标的一种经济行为。由于证券市场的融资功能及其交易的灵活性，上市

学位

上市公司并购并购分析绩效评价

公路施工中的噪声分析与预防

主要从公路施工噪声产生的根源、大小等方面，论述了公路施工噪声污染的特点和对人们日常生活的危害。并提出了解决的方法和思路。

期刊

公路施工噪声污染对策

2013年3月空调零售市场月度简评

一、总体市场:市场回暖环比大幅增长根据奥维咨询(AVC)零售监测数据显示,3月份家用空调零售规模大幅上涨,零售量较上月环比上升246.6%,零售额环比上升234.4%;与去年同期相比,

期刊

零售市场家用空调数据显示AVC

Anisotropic Scattering for a Magnetized Cold Plasma Sphere

The transformation of parameter tensors for anisotropic medium in different coordinate systems is derived. The electric field for a magnetized cold plasma spher

期刊

ANISOTROPYSCATTERINGPLASMAAnisotropyScatteringPlasma

基于DOM修剪的藏文Web信息提取

与本文相关的学术论文