基于信息融合的专利相似度研究——以新一代移动通信技术为例

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:ciyoyo23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似专利是技术相似性、竞争性的体现,表征了企业技术层面的竞争态势分布,通过测量专利相似度从而发现相似专利对专利侵权检测、专利检索、企业竞争分析、专利布局、新技术识别、专利规避、侵权检测、专利诉讼、专利预警等都具有重大意义。目前研究专利相似度的方法主要集中于专利引文和专利文本。这两种方法分别从单一信息源对专利的相似度进行了刻画,都还有一定缺陷。本文提出基于多源信息融合理论,通过线性加权模型对专利相似度进行融合的方法。在通过专利引文计算专利相似度的方法中选择专利耦合,在通过专利文本计算专利相似度的方法中选择了向量空间模型和LDA(latent dirichlet allocation)主题模型,综合考虑专利引文和专利文本对专利相似度的影响,通过遗传算法对三种方法所得的专利相似度赋予不同的权重从而调节各方法对相似度计算影响的大小,从而从而准确地计算专利相似度。该方法与其他方法相比,信息来源更加全面广泛,权重刻画较为客观,从而使专利相似度计算更加准确。  本文是提出理论再选择数据加以实证的过程。选择新一代移动通信技术领域的专利为例,分别计算了基于专利耦合的引文相似度和基于向量空间模型、基于LDA主题模型的文本相似度。相似度的对比分析发现:同样的专利数据集,基于专利耦合和向量空间模型所计算的相似度普遍较小,大多分布在0-0.1区间段。基于专利耦合所计算的相似度大多为0。基于LDA主题模型所计算的相似度大多分布在0.6-0.8区间段。在对各方法所计算出的专利相似度进行标准化处理后,比较结果之间的相关性,确认结果之间无强相关关系之后将其融合。通过精确率,召回率,F值,MAP值评价各相似度。发现通过信息融合之后的专利相似度在精确率,召回率,F值上都有提高,在MAP值上并无提高。最后在上述研究和实证的基础上,总结了本文的结论和展望,以期提升相似度计算效果。
其他文献
西安是丝绸之路的起点城市,也是中国历史上作为古都最多的城市.我们研究问题,如果仅仅局限在长城南北,有一些事是说不清楚的,现将研究范围进行拓展,向北向西追溯其中的脉络,
期刊
运用文献资料等研究方法,依据我国免费师范生教育新要求与我国基础教育未来体育师资素质需求,以体育教育专业排球普修课程为对象,从研究型教学概念入手,探讨了体育教育专业免
网络信息的海量化正在导致网络信息的垃圾化,网络信息本身的价值正在被创造海量网络信息的网络本身所消减,解决了信息资源的短缺问题并不一定会带来价值的提升,只有加强网络
  本文旨在探讨用户对服务质量的评价与用户价值感、用户满意度和用户忠诚度的关系,并分析经用户重要性加权的服务质量各方面对用户满意度和忠诚度的影响程度。  本文利用
论文因存在某种错误成为撤销论文,学术环境下撤销论文数量不断增加,已引起学术界的广泛关注。当前撤销论文的研究一直以论文的撤销原因为主要研究对象,对学术影响的研究还处在探
1组织管理扎实得力1.1领导重视,形成合力学校制定了体育工作3年发展规划。校长坚持主管体育工作,积极贯彻《学校体育工作条例》,落实健康第一思想。同时我们抓好上级文件和《条例
众所周知,在信息检索领域有两种基本的语言现象一直困扰着传统的词汇匹配方法,即同义和多义现象。同义现象影响查全率,多义现象影响查准率。针对这个问题,人们提出了潜在语义索引
本论文较系统地论述了数字图书馆的信息组织与信息构建。 论文首先从传统图书馆信息组织方法在数字图书馆中的应用、元数据信息组织方法、XML语言组织方法、数据库组织方
华东理工大学“体教结合”一条龙培养模式,即在从小学到中学,再到大学的3个阶段中,以俱乐部作为竞技体育人才培育基地,依托各级相关学校作为教育教学基地,制定统一的竟训管理体系,
“长安画派”的缘起是:1961年10月,在北京新落成的中国美术馆举办中国美术家协会西安分会国画研究室“国画习作展”,之后又到上海、南京、杭州、广州等地巡回展出.因为作品独
期刊