利用串匹配技术实现网上新闻的主题提取

来源 :软件学报 | 被引量 : 0次 | 上传用户：KOUHUIKING

【摘要】

：

从文本中提取主题串是自然语言处理的重要基础之一，传统的提取方法主要是依据“词典加匹配”的模式，由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度，而且词典的内容也

【作者】

：

尹中航王永成等

【机构】

：

上海交通大学电子信息学院

【出处】

：

软件学报

【发表日期】

：

2002年2期

【关键词】

：

网页信息处理网上新闻主题提取自然语言处理串匹配技术 Web information processing Internet news subjec

【基金项目】

：

Supported by the National Natural Science Foundation of China under Grant No.60082003 (国家自然科学基金)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从文本中提取主题串是自然语言处理的重要基础之一，传统的提取方法主要是依据“词典加匹配”的模式，由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度，而且词典的内容也无法完全涵盖网上新闻的范围，因此这种方法不适用于网上新闻的主题提取，提出并实现了一种不用词典即可提取新闻主题的新方法。该方法利用网上新闻的特殊结构，在标题和正文间寻找重复的字串。经过简单的处理，这些字串能够较好地反映新闻的主题，实验结果显示该方法能够准确、有效地提取绝大部分网上新闻的主题，满足新闻自动处理的需要。该方法同样适用于其它亚洲语

其他文献

利用自回归模型生成中国画风格水动画

提出一个生成中国画风格水动画的方法.首先检测手工绘制国画水波的位置,然后利用自回归模型合成这些水波形状.合成的水波用基于图像方法来绘制以使水波与手工绘制国画风格一

期刊

水模型非真实感动画计算机动画中国画自回归模型Computer aided designComputer graphicsImage process

关于“为设计认证协议的一个简明逻辑”一文的注记

Buttyan等人提出了一个简洁的逻辑,他们把它用于改进Woo-Lam协议,并且未证明地声称:改进后的协议是抗协议与自身的交互攻击的.为表明他们的结论是不正确的,找到了改进协议的

期刊

义互攻击安全性模态逻辑认证协议Woo-Lam协议protocol interaction attack security modal logic

中职计算机课项目教学法浅析

提高学生计算机理论水平和实践动手能力,培养企业所需要的人才,是中职学校计算机教育的首要任务。由于中职学生理论水平不高,计算机学习效率低下,在中职计算机课程中采用项目

期刊

中职学校项目教学法计算机基础课

浅谈建筑水彩教学

在建筑水彩教学中,应注意用实例辅助理论教学,制定课程教学目标,以提高教学效果。

期刊

建筑水彩教学案例目标

全光双向网络中的波长转换

在许多光学路由中，对于给定一组通讯路的集合，必须对有公共边的路安排相同的波长，为了充分利用光学的带宽，目的是安排尽量少的波长数，但有时候也考虑使用波长转换器，如果一个顶点安

期刊

全光双向网络波长转换近似算法WDM网络顶点覆盖充分集approximation algorithm WDM network wavelength

基于扩展角分类神经网络的文档分类方法

CC4神经网络是一种三层前馈网络的新型角分类（corner classification)训练算法，原用于元搜索引擎Anvish的文档分类。当各文档之间的规模接近时，CC4神经网络有较好的分类效果，然而

期刊

角分类神经网络文档分类数据索引距离信息document classification CC4 neural network data indexi

面向大规模网络的基于政策的访问控制框架

研究防火墙(或过滤路由器)应用于传输网络中的管理问题与吞吐量问题.一方面,手工配置分布在各个接入点的大量防火墙,无法满足开放的、动态的网络环境的安全管理需求;另一方面

期刊

计算机网络网络安全访问控制防火墙安全政策散列表AlgorithmsComputer networksControlInternetLarge

误诊为肺结核的肺肉瘤样癌1例

<正>临床资料患者52岁,男性,农民,长期吸烟,1包/天,约30年。因"反复咳嗽、咳痰、呼吸困难半年"予2017年12月29日入院。查体:体温37. 2℃,脉搏96次/分,呼吸21次/分,血压134/85

期刊

肺肉瘤样癌肺不张演化机理左主支气管肺结核支气管镜检查纤支镜活检干酪样坏死物多西他赛上皮间充质转化周围型中央型全肺切除术支气管内膜结核

余创的养鱼路越走越宽

一位农村青年叫余创,他1990年初中毕业后,因家境困难,告别贫瘠的故土,挤上南下的列车,去广东湛江姨父家打工。在姨父家近一年,学到了姨父的一些养鱼技术。1991年4月回到家中

期刊

养鱼技术茶枯湖南农业有机肥基本技术合理投喂无病先防成功秘诀农村青年常用药物

无线自组网中基于移动预测与功率调整的适应性分簇算法

传送功率控制是无线自组网中资源管理和控制干扰的中心技术、传统上功率控制只是用作消除信道消隐负作用的一种手段，当前观点一般认为功率控制是一种可以为单个用户提供服务质

期刊

无线自组网移动预测功率调整适应性分簇算法功率控制CDMAAd hoc networks mobility prediction power co

利用串匹配技术实现网上新闻的主题提取

与本文相关的学术论文