利用词嵌入模型实现基于网站访问日志的专利聚类研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:ericli2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用。利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足。[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了Patent Freq2Vec模型,计算得出专利关联信息。[结果/结论]利用Patent Freq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法。
其他文献
本文基于前人的研究和大量语言事实的基础上提出了介词短语“在+处所”三种语义功能:(1)事件发生的时间;(2)动作发生的地点或状态存在的地点;(3)受事或施事因动作而达到的地点。
无论社会如何变化与进步,社区治理都是一个城市乃至一个国家发展的重要前提。中国社会目前所处的是一个高速运转时代,使得社区治理变得愈加困难和复杂,如何将新科技更好地运
目的探讨弥漫性细支气管肺泡癌的CT表现特征,并确定弥漫性细支气管肺泡癌与肺结核鉴别诊断的一些有益表现。方法对经病理证实的25例弥漫性细支气管肺泡癌患者的CT表现进行回
<正>目的抑郁症病人常报告生活质量(Quality of life,QoL)低,与普通人群相比,其残疾比率和残疾严重程度增加。本研究为一项事后分析,对中国抑郁症患者生活质量,疼痛性躯体症
会议
现代文学发展的前三十年中,文学大师匠心独运,创作出文坛上经典不朽的篇章。作品中出现迥异于传统深刻复杂的女子形象。《金锁记》中的曹七巧——被誉为我国现代文学史“最美
精神分裂症是一组病因不明的精神病,复发率高。为了了解精神分裂症的复发原因,以便采取相应的护理对策。本文对100例复发的精神分裂症病人作了调查,现将结果报道如下:
制定一个有效的教育改革方案是一件复杂,困难的任务。但在所有新近的研究文献和国外教学经验中,告诉我们一个重要的事实:家长参与是成功的要素之一。事实上从儿童的心理发展
安徽枞阳方言是笔者的家乡方言,属皖北江淮官话。该方言区存在大量与现代汉语普通话不同的语法现象,这些语法现象的产生不是该方言独立发展而形成的,它们应该是近代汉语北方官话
近日,全国首个国家级农业科创中心一南京国家现代农业产业科技创新示范园区开工建设并举办发展推介大会.该园区总体布局为“一核四园多基地”,“一核”指建设以科技创新、高