半监督的网络科技信息分类模型

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户：khsim

【摘要】

：

【目的】开放的网络科技信息网页内容之间区分度较小,传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求。【方法】通过深入分析网络科技信息主题网

【作者】

：

李传席张智雄刘建华钱力

【机构】

：

中国科学院文献情报中心,

【出处】

：

现代图书情报技术

【发表日期】

：

2014年11期

【关键词】

：

信息分类网络科技网页分类网络科技信息模型网页网页内容贝叶斯方法开放资源特征词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

【目的】开放的网络科技信息网页内容之间区分度较小,传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求。【方法】通过深入分析网络科技信息主题网页的内容和结构,利用开放本体等资源实现领域特征的学习,构建半监督的网络科技信息分类模型。【结果】实验结果表明提出的方法在网络科技信息分类实验中的精度、召回率和F1值分别达到0.9016、0.8756和0.8884,相比贝叶斯方法具有明显优势。【局限】该方法在应用到其他类别的网络科技信息分类时,仍然需要领域专家提供相关领域的核心种子特征。【结论】该方法可以满足网络科技信息深度加工的需求,实现有效的网络科技信息网页分类。 [Purpose] The distinction between open web content of S & T information is small. The traditional rules-based and statistical learning methods can not meet the specific application requirements of Web S & T information classification. 【Method】 Through the analysis of the content and structure of the web pages of the subject of network science and technology information, using the open ontology and other resources to realize the learning of the domain characteristics, a semi-supervised network technology information classification model was constructed. 【Result】 The experimental results show that the accuracy, recall and F1 of the proposed method are 0.9016, 0.8756 and 0.8884, respectively, which have obvious advantages over Bayesian method. [Limitations] This method still requires field experts to provide the core seed characteristics in relevant fields when applied to other categories of network science and technology information classification. 【Conclusion】 This method can meet the needs of deep processing of network technology information and realize effective classification of web technology information web pages.

其他文献

《社会工作实务(中级)》考前模拟强化训练题二

一、案例分析题第一题刘某,女,16岁,小学毕业后一直辍学在家,没有一技之长。现在与外公外婆一起居住,父母很少关心她,家庭经济条件很差,要靠低保维持家庭生活。患有哮喘病,体

期刊

工作实务外公外婆案例分析家庭经济条件小学毕业工作机构小组工作案主家庭生活卢湾区民政局

感性推动的消费时代

据国家统计局调查数据显示,近半年城镇居民人均收入以较快速度增长,恩格尔系数持续降低。这表明我国宏观调控取得积极成效,国民经济继续保持平稳快速的发展。而零点研究咨询

期刊

居民人均收入生活质量调查恩格尔系数城市居民收入水平中高收入数据显示休闲生活职场新人统计局调查

广州白云国际广告有限公司总经理王卫:勇做广告市场的“弄潮儿”

民航国有广告企业的改革者 2003年2月,广州白云国际机场股份有限公司广告分公司成功改制为广州白云国际广告有限公司。这在全国众多的民航广告企业中,是一次创新和突破。王

期刊

广告有限公司白云国际广告企业中国广告业民航系统白云机场广告资源广告运作现代广告焦点人物

空压机噪声的控制方法

本文针对现已使用的空压机,从噪声控制影响因素、措施、空压机的振动问题以及空压机管道问题等方面来阐述空压机的噪声特性、产生部位及其控制方法。 In this paper, the ex

期刊

空压机噪声控制噪声噪声评价曲线噪声特性隔声罩影响因素吸声隔振超出量

通用型手动液压泵

为了使液压系统在发生主泵故障或不适宜启动主泵的情况下,能够实现应急性继续工作或者作为一种手动液压源,我们在研究改进国外样机的基础上,设计了一种通用型手动泵,其型号

期刊

通用液压泵主泵江苏盐城市手动泵液压系统液压源小批量生产液压执行机构应急性

化学热泵

化学工业所涉及的行业多,产品范围广、用途多、产量大,是国民经济各部门中消耗能源较高的部门之一。世界各国化工生产的能耗约占工业生产总能耗的20％,而能量的利用率却不高。

期刊

热泵化学工业需用量产品范围能耗热量基准金属氢化物节能技术低温热源

China's Grain Output and Grain Policy

Ⅰ.A Special Feature of China:The Syn- chronous Increment of Grain Output and PopulationSince the founding of the People’s Republic of Chinain 1949,there has

期刊

GrainfoundingRepublicfluctuatingproportionalremarkablyincomeimportscreas

结婚恋爱大不同

以前看过柏杨的一篇文章,说十个女人有九个会在婚后感到失望的。明明是自己选定的那个人,为什么在婚后会失望呢?这个问题困扰了我很久,直到自己也结了婚,才恍然大悟,原来如此

期刊

原来如此柏杨婆媳关系饭来张口处事态度社交活动朝夕相伴公成天差地别闲暇时间

中国期刊网开通中国知识基础设施工程启动

本刊讯中国期刊网开通仪式暨中国知识基础设施工程规划报告会于１９９９年６月１８日在北京清华大学隆重举行。清华大学校长、中国学术期刊（光盘版）编委会主任王大中院士宣布中国期刊网（ＣｈｉｎａｊｏｕｒｎａｌＮｅｔ）正式开

期刊

中国期刊网中国学术期刊基础设施清华大学校长王大中北京清华大学工程规划知识经济时代期刊信息特色期刊

电机声功率级的振动测量法

机器作为声源所辐射的声功率级可分成二部份:一、机器表面振动所辐射的声功率级;二、机器通风系统所辐射的声功率级。但通过机器表面振动速度级的测量来计算振动声功率级的

期刊

声功率级振动测量辐射效率表面振动计权计权网络频率响应范围测量仪器声功率速度级

半监督的网络科技信息分类模型

与本文相关的学术论文