Web科技新闻分类抽取算法

来源 :淮阴工学院学报 | 被引量 : 0次 | 上传用户：hgs26

【摘要】

：

为了改善从Web上获取的新闻信息的使用价值,针对Web网站存在大量非科技相关新闻的现状,以互联网上政府新闻网站、凤凰网等新闻为研究背景,选取TF-IDF文本加权方法,设计了科技

【作者】

：

朱全银潘禄刘文儒李翔张永军刘金岭

【机构】

：

淮阴工学院计算机与软件工程学院

【出处】

：

淮阴工学院学报

【发表日期】

：

2015年5期

【关键词】

：

科技新闻文本分类 TF-IDF 抽取算法 scientific-related news text categorization TF-IDF extr

【基金项目】

：

国家星火计划（2011GA690190）, 江苏省科技支撑计划（2015）, 江苏省高校自然科学研究面上项目（15KJB520004）, 淮安市科技支撑计划（HAG2014023,HAG2014028）, 淮安市“533英才工程”项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了改善从Web上获取的新闻信息的使用价值,针对Web网站存在大量非科技相关新闻的现状,以互联网上政府新闻网站、凤凰网等新闻为研究背景,选取TF-IDF文本加权方法,设计了科技新闻多层次二分类模型,实现了基于TFIDF的科技新闻文本分类抽取系统,在20万新闻文档和4000多种分类上,实验取得了科技新闻85.3%的识别准确率和非科技新闻82.9%的识别率,为Web科技新闻分类抽取提供有实用价值的参考模型。

其他文献

传动装置的新进展

概述了用于露天和地下矿山设备的机械，电气和液力传统系统的最新进展，包括ＳＤＰ公司的高效无级变速箱，乔伊公司和沃思公司研制的涡轮技术传动系统。ＢＪＤ公司研制的开关磁阻式驱动器和福克

期刊

矿山机械传动装置结构特点机械性能

优化低年级的阅读教学

汉语具有以声传情的特点。通过语句参差错落或整体错落有致的变化,可以造成声音的变化;通过语调、语音的停顿、平仄的调节,可以形成抑扬顿挫的音乐感,这也正是汉语的魅力所在。而诵读不仅可以体现汉语这一特点,也可以促进学生对所学内容的领悟与把握。因此,在语文教学中加强诵读教学显得尤为重要。而在当前低年级的阅读教学中,仍存在朗读时间少、学生自己想怎样读就怎样读、教师对学生的朗读指导不到位等现象。面对此种情况,

期刊

阅读教学低年级优化诵读教学朗读指导语文教学汉语音乐感

利用计算机网络建立在线教学资源共享交流平台

目前，我国高中校园网络已经基本建成，但是，各种优秀的教学资源还没有得到充分共享，在提高教学质量和促进实现教育公平方面的重要作用还未充分发挥出来。　　1 引言　　为了将分散的优秀教学资源经过整合实现充分共享，发挥出优质教学资料促进教学改革、提升教育质量方面的重要作用，应用计算机网络技术，设计了此在线教学资源共享交流平台解决方案。此方案由媒体资源和知识单元资源两大资源模块组成，媒体资源包括文本、图形图

期刊

教学资源共享计算机网络交流平台在线校园网络教学质量分发

基于SAABB算法的VAEAS的探究

从技术基础、系统架构、功能模块设置、数据库设计和关键技术研究共五个方面探讨了基于SAABB算法的VAEAS的构建。叙述了系统架构、部分功能模块和部分数据库设计，重点描述了WR

期刊

VRMLSAABB算法虚拟装配事件监听VRML SAABB algorithm virtual assembly event monitoring

“399植物生长微电活能”对茶叶产量的影响

" 399植物生长微电活能"由纳米级转光材料和多种氨基酸复合而成.随气温变化自动调控植物电阻,能缩短植物"休息"时间,具有抗寒、抗旱和增强光合作用的能力.笔者以清水为对照,

期刊

“399植物生长微电活能”茶叶产量影响因素生长发育

科学应用多媒体提升教学质量

在众多教学媒体中，多媒体技术越来越受到教师的青睐。以语文教学为例，应用多媒体技术，可以大幅度增强教学效果，丰富教学内容，提升教学质量。但在应用中，要注意科学运用，不可不把握其“辅助”作用，不可“滥”用。　　1 多媒体技术应用于教学对增强教学质量效果明显　　1.1 备课质量提高　　语文课堂是学生获取知识的主要园地之一。为了提高教学质量，为了能给学生一杯水，教师就得准备一桶水。一节课备下来，面前的书已

期刊

多媒体技术教学质量应用科学教学媒体语文教学教学效果教学内容

茶园人工生态群落系统生态功能研究

根据生态学原理,采用定点定位方法对茶园人工生态群落系统生态功能的优良性,系统的能值和蒸散力以及光效能与生物信息进行了研究。结果表明:茶园人工生态群落系统具有良好的

期刊

茶园人工生态群落系统生态功能

保护伞结合血管内支架治疗颅颈部动脉狭窄的护理

颅颈部动脉狭窄是缺血性脑血管病的主要病因之一.我院介入科现采用血管内支架结合保护伞治疗颅颈部动脉粥样硬化性狭窄,效果良好,创伤小、术后康复快.现将护理体会总结如下.

期刊

保护伞血管内支架治疗颅颈部动脉狭窄护理

略论中国古代诗歌注释学的分期和特点

中国古代诗歌注释学源远流长，是古代学术系统的重要分支。按照其演变轨迹，可分为五个时期，即唐前的滥觞期、唐代的初兴期、宋代的兴盛期、金元明的转型期、清代的鼎盛期，每个时期