基于标签内特征词的OA期刊站点自动分类方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:asdfghjkg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开放存取(OA)期刊站点的自动分类是整合OA期刊论文资源建立数字资源库的前提.文中提出一种基于网页标签内特征词的OA期刊站点自动分类方法.首先.抽取网页不同HMTL标签中的词构建语料库,将网页中不同的标签赋予不同的权值,并提出了最优权值计算算法,据此对TF* IDF计算模型进行改进,从而计算特征词权值得到文本向量表示;然后,计算每两个类别的最小欧氏距离,取最小欧氏距离较大的一对类别构建上层分类节点,对有向无环图支持向量机(DAG-SVM)的构建过程进行改进;最后,利用改进的DAG-SVM对OA期刊站点进行分类.实验结果表明,该方法具有较好的分类效果.
其他文献
本文综述了植物光周期的研究进展,包括:光周期与植物成花诱导、农艺性状、产量形成、生理生化指标的研究.
健全的农田水利工程体系和完善的管理措施,将很大程度上缓解自然灾害给人民群众生活带来的不便,减少农业生产的损失.加强农田水利设施建设,是解决农村人畜吃水,确保农业生产,
春玉米地套种夏黄豆,黄豆提前播种避过秋旱,可以实现增收的好效益,为实现农民增产增收提供效途径,2010-2011年在宜州市庆远镇推广春玉米套种夏黄豆高产栽培技术,从品种选择、
随着社会的发展和科技的进步,我国的经济水平不断提高,尤其是近年来市场上反季节蔬菜的需求不断增加,我国的温室大棚建造面积不断扩大.但是由于温室大棚的内部经常处于高温高
运用高压液相色谱法,开展25%噻虫嗪水分散粒剂在梨上的消解动态和最终残留试验,结果表明,该农药的半衰期为3.4天,按5000倍稀释使用后,最后一次施药后14d在梨中的残留量仅为0.0
文章通过对大量调查研究资料的分析和比较,提出了关于粤东闽语内部应该分为2个方言片和4个方言小片的新观点。文章从语音和词汇两个方面对粤东闽语的内部差异作了介绍和分析
实践是马克思创立的实践唯物主义的核心范畴,也是马克思主义唯物史观的基石。对马克思主义实践范畴的含义的科学阐释和澄清,其意义不仅关乎马克思主义哲学学科的要求,而且也
目的:探讨开展"品管圈"活动提高痤疮患者健康教育的知晓率的效果.方法:成立"品管圈"对门诊治疗室痤疮患者健康教育知晓率现状进行调查,并分析痤疮患者健康教育知晓率低的原因
A systematic theoretical approach is developed to study the electronic and transport properties of a twodimensional electron gas (2DEG) in the presence of spin-
在近三十年的中国文学环境中,创新焦虑迫使单个的文学主体在求新的道路上进行不断的自我否定,在潮流的抛掷中丧失了独立性;在惟新是崇逻辑的统摄下,“创新”成了无视中国文学