中文专利文本聚类方法研究

来源 :海峡科学 | 被引量 : 0次 | 上传用户：zm_free

【摘要】

：

该文提出了一种针对中文专利文本的聚类方法.使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果.这样的组合可以在提高聚

【作者】

：

林俊黄雄杰陈平

【机构】

：

福建省知识产权信息公共服务中心

【出处】

：

海峡科学

【发表日期】

：

2013年12期

【关键词】

：

K-means SOM LSI 文本聚类中文专利

【基金项目】

：

福建省科技计划项目《企业专利预警应用的混合聚类关键技术研究》(项目编号:2012H0016)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文提出了一种针对中文专利文本的聚类方法.使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果.这样的组合可以在提高聚类准确率的同时,降低运行时间.在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷.

其他文献

企业实施全面创新管理的思考

建设创新型企业、增强自主创新能力是经济可持续发展的迫切需要，以培养企业核心能力、持续提高竞争力为导向，以价值创造为最终目标，以各种创新要素的有机组合和协同创新为手段，通

期刊

全面创新管理创新型企业创新管理机制全时空创新全员创新

普利司通发布全球最强橡胶技术

<正>来自全球最大的轮胎制造商日本普利司通公司日前宣称它已经发明了一种将橡胶和树脂在分子水平上结合成杂化聚合物的方法,这种材料可能会减少轮胎所需的聚合物材料的数量

期刊

普利司通

从“故事”里外的链接看家园共育特色

幼儿阶段的孩子年龄较小,运用故事进行幼儿教育已经是当今幼儿教育发展的必然趋势。用故事搭建园所和家庭的互动平台,会形成教育合力,构建一个和谐的教育环境,幼儿、家长、教

期刊

家园共育幼儿故事

基于多粒度语言的动态联盟合作伙伴群决策

客观事物的复杂性和人类认识的局限性使得评价指标的数据很难用一个精确数表示，具有不同程度的不确定性。在比较分析现有各种表达不确定性方法的基础上，提出了基于多粒度语言的

期刊

动态联盟多粒度语言优化正态分布ET-COWGA

B类不确定度计算方法的探讨

本文介绍了计算B类不确定度的一般方法 ,给出了一些常见B类不确定度的计算实例。

期刊

B类不确定度概率分布置信因子

生长前期北京鸭赖氨酸需要量的研究

试验采用单因子完全随机试验设计研究赖氨酸对7～21日龄雄性北京鸭生产性能和胴体品质的影响，进而探讨生长前期北京鸭赖氨酸需要量。280只7日龄雄性北京鸭随机分为5个处理，每处理

期刊

北京鸭赖氨酸需要量

高校女生篮球选项课分层递进教学探讨

分层递进教学体现了＂以人为本、以学生发展为中心＂的教育思想,能克服教学中优秀生＂吃不饱＂、差生＂吃不了＂的现象,激发学生的学习兴趣和练习积极性,满足不同层次学生的学习需要,促进

期刊

高校体育分层教学主体性教育因材施教

浅析GNSS技术在农村不动产测绘中的应用

全面开展平湖市农村宅基地及其地上房屋等建筑物、构筑物的权籍调查,形成适合本地区的农村不动产权籍调查技术方法和实现路径,切实规范和促进全市农房不动产权籍调查,为全市

期刊

GNSS网不动产测绘房产测绘

安阳市水质现状分析与应对策略

通过对河南省安阳市水质现状的调查与分析，找出了导致安阳市水污染的根本原因，并且提出了从保持经济发展与资源、环保相协调，健全并改进水质监测网络，严格控制污染物的排放量，改革

期刊

水质污染水质监测现状分析

雌激素受体亚型ER-α36与乳腺癌关系的研究进展

雌激素受体（estrogen receptor,ER）是一类有配体激活的核转录因子,介导大部分的雌激素反应,在体内具有重要的生理功能效应。ER主要分为ER-α和ER-β两个亚型,其中ER-α主要表达

期刊

乳腺癌雌激素受体雌激素受体-α36雌激素受体-α

中文专利文本聚类方法研究

与本文相关的学术论文