文本结构分析与基于示例的文本过滤

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:gm_686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文简要介绍了文本过滤的背景和发展 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用本文提出的文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模版 (user profile) ,然后进行文本过滤 ,同时引进段落匹配机制 ,提高过滤效率 .通过用户反馈 ,改进用户模版 This paper briefly introduces the background and development of text filtering and puts forward an example-based Chinese text filtering model.The basic idea is to analyze the text structure of the sample text proposed by the user firstly, and then extract the text features by using the text-level analysis method proposed in this paper, Form a user profile of the keyword representation, then perform text filtering, introduce a paragraph matching mechanism to improve the filtering efficiency, and improve user templates through user feedback
其他文献
随着网络化的日益普及 ,现有计算机系统面临着复杂和难以集成的问题 .以 CORBA为主流技术的分布对象计算技术简单有效地降低了非实时应用的复杂度和集成难度 .但是 ,现有的 C
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
上海日用化学研究所陈岚等利用摩尔质量分布很窄的线性端羟基聚二甲基硅氧烷WS-62M代替D4与氨烷基硅烷在80 ℃、真空下进行酯交换,相同温度下用KOH作催化剂进行聚合反应,得到氨
目的对极低放固体废物处理人员个人剂量进行估算,检验其年有效剂量能否满足企业管理目标值要求。方法根据《极低水平放射性废物的填埋处置》(GB/T 28178-2011)提供的外照射剂
培两优288作再生稻种植,平均年产量11.74t/hm~2,可增收1396.8元/hm~2,省工60个/hm~2并总结了其高产栽培技术。 Peiliangyou 288 was planted as ratoon rice with an averag
Dow Corning的健康护理工业业务部推出了经测试可满足美国药典Ⅵ级要求的有机硅弹性体生产线。该系列的弹性体满足了非植入医疗器件和药品加工模压制品生产者的需要。目前可
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
本文简要介绍了 CORBA/Java技术 ,给出了一个对象 Web的系统模型 ,探讨了实现对象 Web的方法以及它相对于传统 Web技术的优势 .这一系统已用于实际应用中 ,并且作为一个通用
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
Wacker推出了新一代织物柔软剂JETSOFTENFS。它第一次使有机硅柔软剂能在上染工艺中运用而不会在喷射染色机中引起问题。传统的有机硅柔软剂以乳液的形式应用,其所含的乳化剂