论文部分内容阅读
摘 要:文章提出的方法为Patentics系统,提供了丰富的检索字段,再加上各种通配符、模糊、近邻词检索和逻辑运算,使得检索人员在对语义检索结果进行人工干预时,能够组合不同的干预方式,从而获得更好的检索效果。
关键词:Patentics;检索字段;人工干预
Patentics是索意互动(北京)信息技术有限公司开发的智能化信息处理系统。Patentics提供了3种类型的检索字段,分别是基础字段、修饰字段和高级字段,以及通配符、模糊、近邻词检索和逻辑运算,检索方式简单,浏览界面直观,一条简单的检索式就能获得相关度很高的文献。
上述3种类型的检索字段包括:基础字段61个,主要涉及语义排序、概念检索、关键词等常规检索字段;修饰字段20个,主要涉及检索数量、申请人、日期、相关度和同族的过滤字段;高级字段60个,主要涉及专利引用、运营、复审、诉讼、无效的相关字段。
在实际应用中发现,目前使用Patentics进行语义检索存在的主要问题是:不能有效提取发明构思以及无法使用精确分类。即在使用Patentics进行语义检索时,多数情况下,需要检索人员在理解技术方案的基础上对Patentics的检索过程进行人工干预,才能充分借助其优势实现检索效能的提高[1]。而由于Patentics系统本身提供了丰富的检索字段,再加上各种通配符、模糊、近邻词检索和逻辑运算,使得在检索过程中能够获得多种不同组合的人工干预方式。
1 不同人工干预方式在实际案例中的应用
1.1 案例介绍
案例1(CN2016107939310):绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor,IGBT)功率模块结构,其特征在于:IGBT模块组,所述IGBT模块组由IGBT模块并联组成;IGBT驱动板,所述IGBT驱动板连接IGBT模块组,位于IGBT模块组外侧;直流母排,所述直流母排一端连接IGBT模块组,位于IGBT模块组外侧;交流铜排,所述交流铜排一端连接IGBT模块组,位于IGBT驱动板外侧;散热器,所述散热器两侧各连接一个IGBT模块组,两个IGBT模块组及与之连接的IGBT驱动板、直流母排和交流铜排以散热器为对称面镜像对称。其电路结构如图1所示。
1.2 根据技术方案选择检索字段进行人工干预
首先,在Patentics系统中直接进行语义检索。Patentics 的完整检索界面和专业图文界面均提供主搜索輸入框,选择相应的数据库后一般输入“R/申请号”或者“R/公开号”即可获得最相关的400条结果。对于本案,在完整检索界面中直接输入“R/cn106253701”进行检索,经过浏览后找到目标文献“CN202034891U”,出现在检索结果的第8屏,也就是大约第160篇的位置。为提高命中效率,在接下来的步骤中分别从不同的方面提取检索要素,并结合Patentics提供的不同检索字段对上述结果进行人工干预[1]。
根据发明的主题提取检索要素:本申请要求保护一种“IGBT功率模块结构”,可以提取到关键词“IGBT”或“功率(模块)”。同时,根据该主题查找是否有合适的分类号,通过查找分类表发现,H02M1/00大组:“H02M1/00 变换装置的零部件”符合上述主题。因此,根据从主题提取出的检索要素对检索结果进行干预。在Patentics提供的基础字段中,选用字段“B/”和“ICL/”,其中,“B/”为关键词字段,作用是对全文的关键词进行检索,包括专利文献中的所有文字,“ICL/”表示国际分类,用于对国际分类号进行检索。分别采用检索式“R/cn106253701 AND B/(IGBT OR 功率)”和“R/cn106253701 AND ICL/H02M1”进行检索,从检索结果看到,目标文献分别提到了第6屏和第4屏的位置。
从功能角度对检索要素进行提取:在上述IGBT功率模块的结构中,主要器件除了IGBT之外是散热器,即模块的主要功能是提供IGBT功率器件的散热。根据上述功能提取到关键词“散热”或“冷却”。同样查找是否有符合上述功能的分类号,通过查找分类表发现,H05K7/00大组下,有相关的分类号,即:
(1)H05K7/00:对各种不同类型电设备通用的结构零部件。
(2)H05K7/20:便于冷却、通风或加热的改进。
其中,H05K7/20包括对电设备的零部件进行冷却的结构,是符合上述散热功能的分类号。此处仍然选用关键词字段“B/”和分类号字段“ICL/”进行人工干预。分别采用检索式“R/cn106253701 AND B/(散热OR冷却)”和“R/cn106253701 AND ICL/H05K7/20”进行检索,结果显示,两种干预方式均将目标文献提到了第5屏的位置,其中,采用分类号干预的方式位置更加靠前一些。
为了使得检索结果的命中率更加精准,通过对技术方案进行分析,根据发明点来提取关键词进行检索。通过对权利要求1的方案进行分析,并结合说明书的记载“本发明由至少两个IGBT功率模块并联成IGBT功率模块组,并对称分布在散热器两侧,在同样的面积内,增加功率密度,降低功率模块的制作成本,同时,对称的设置可以避免IGBT模块不均流”,可以得到本申请主要通过将IGBT模块中的各器件以散热器为中心对称排布,从而实现了功率密度的提高。根据其中的“以散热器为中心对称排布”,提取关键词“中心”“对称”和“镜像”,采用检索式“R/cn106253701 AND B/(中心OR对称OR镜像)”进行检索,目标文献进一步提到了第2屏结尾处的位置。
由于关键词字段“B/”是对全文关键词进行检索,可能导致检索结果范围过大。尝试采用组合检索字段“A/”(其中包括了标题或摘要或权利要求中含有的关键词)和权利要求字段“ACLM”进行检索,以缩小检索结果范围。分别采用“R/cn106253701 AND A/(中心OR对称OR镜像)”和“R/cn106253701 AND ACLM/(中心OR对称OR镜像)”进行检索,相对于上一步用“B/”关键词检索字段进行检索,目标文献均提到了第2屏靠前的位置。也就是说,基本上浏览30篇以内的文献便可以找到目标文献。 在逻辑算符的选取上,常见的“AND”和“OR”算符,往往难以限定出较为具体并高度相关的检索要素。Patentics同样提供了其他逻辑算符可供使用。比如邻近算符:“adj/”为区分位置的邻近算符,如散热器和对称间相距小于等于5个字:用b/“散热器 adj/5 对称”,检索结果中散热器位置在对称之前;“adjn/”为不区分位置的邻近算符,如散热器和对称间相距小于等于5个字:用b/“散热器 adjn/5 对称”,散热器和对称的位置可以互换,检索结果中二者的前后位置不作区分。注意,仅支持两个词的邻近运算,并且邻近算符需在双引号中使用。具体到本案例,在上述对于发明点的分析来进一步提取检索要素,由于“本申请主要通过将IGBT模块中的各器件以散热器为中心对称排布”,因此,采用邻近算符“adjn”来构建新的人工干预检索式,分别采用检索式“R/cn106253701 AND B/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”和“R/cn106253701 AND ACLM/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”进行检索,检索结果的位置均得到了大幅提升,其中,采用检索式“R/cn106253701 AND ACLM/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”进行检索,目标文献位于检索结果的第10篇,大大提高了检索效率。
2 结语
Patentics系统提供了丰富的检索字段,根据不同的字段特点能够实现不同方面的人工干预。一定程度上弥补了Patentics语义检索中,由于不能有效提取发明构思以及无法使用精确分类,导致检索范围过大的缺点。
在采用人工干預方式的具体应用中,通常情况下,对于具有相对准确分类号的某些技术特征,采用分类号进行干预的检索结果要比采用关键词的结果更优;在标题、摘要和权利要求中的检索结果要比在全文中进行检索的结果更优。但同时也可能导致遗漏某些目标文献。
灵活运用模糊、邻近词语检索等逻辑算符构建检索式,Patentics提供了许多其他类型的逻辑算符,如“adj/”“adjn/”“equ/”等,相对于“AND”与运算和“OR”或运算算符,在检索结果范围过大时,采用这些邻近算符能够构建出更加合理的检索式,从而大大提高检索效率。
[参考文献]
[1]容淦,张晓冬,胡玉连.Patentics的不同干预方式在玻璃领域的检索应用研究[J].图书情报导刊,2017(2):68-78.
Retrieval application of artificial intervention with different retrieval fields of patentics
Ding Ran
(Beijing Center for Patent Examination, State Intellectual Property Office, Beijing 100071, China)
Abstract:The method proposed in this paper provides a wealth of retrieval fields for Patentics system, coupled with all kinds of wildcards, ambiguity, nearest neighbor word retrieval and logical operation, so that retrieval personnel can combine different intervention methods when they manually intervene in semantic retrieval results, so as to obtain better retrieval results.
Key words:Patentics; retrieval field; manual intervention
关键词:Patentics;检索字段;人工干预
Patentics是索意互动(北京)信息技术有限公司开发的智能化信息处理系统。Patentics提供了3种类型的检索字段,分别是基础字段、修饰字段和高级字段,以及通配符、模糊、近邻词检索和逻辑运算,检索方式简单,浏览界面直观,一条简单的检索式就能获得相关度很高的文献。
上述3种类型的检索字段包括:基础字段61个,主要涉及语义排序、概念检索、关键词等常规检索字段;修饰字段20个,主要涉及检索数量、申请人、日期、相关度和同族的过滤字段;高级字段60个,主要涉及专利引用、运营、复审、诉讼、无效的相关字段。
在实际应用中发现,目前使用Patentics进行语义检索存在的主要问题是:不能有效提取发明构思以及无法使用精确分类。即在使用Patentics进行语义检索时,多数情况下,需要检索人员在理解技术方案的基础上对Patentics的检索过程进行人工干预,才能充分借助其优势实现检索效能的提高[1]。而由于Patentics系统本身提供了丰富的检索字段,再加上各种通配符、模糊、近邻词检索和逻辑运算,使得在检索过程中能够获得多种不同组合的人工干预方式。
1 不同人工干预方式在实际案例中的应用
1.1 案例介绍
案例1(CN2016107939310):绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor,IGBT)功率模块结构,其特征在于:IGBT模块组,所述IGBT模块组由IGBT模块并联组成;IGBT驱动板,所述IGBT驱动板连接IGBT模块组,位于IGBT模块组外侧;直流母排,所述直流母排一端连接IGBT模块组,位于IGBT模块组外侧;交流铜排,所述交流铜排一端连接IGBT模块组,位于IGBT驱动板外侧;散热器,所述散热器两侧各连接一个IGBT模块组,两个IGBT模块组及与之连接的IGBT驱动板、直流母排和交流铜排以散热器为对称面镜像对称。其电路结构如图1所示。
1.2 根据技术方案选择检索字段进行人工干预
首先,在Patentics系统中直接进行语义检索。Patentics 的完整检索界面和专业图文界面均提供主搜索輸入框,选择相应的数据库后一般输入“R/申请号”或者“R/公开号”即可获得最相关的400条结果。对于本案,在完整检索界面中直接输入“R/cn106253701”进行检索,经过浏览后找到目标文献“CN202034891U”,出现在检索结果的第8屏,也就是大约第160篇的位置。为提高命中效率,在接下来的步骤中分别从不同的方面提取检索要素,并结合Patentics提供的不同检索字段对上述结果进行人工干预[1]。
根据发明的主题提取检索要素:本申请要求保护一种“IGBT功率模块结构”,可以提取到关键词“IGBT”或“功率(模块)”。同时,根据该主题查找是否有合适的分类号,通过查找分类表发现,H02M1/00大组:“H02M1/00 变换装置的零部件”符合上述主题。因此,根据从主题提取出的检索要素对检索结果进行干预。在Patentics提供的基础字段中,选用字段“B/”和“ICL/”,其中,“B/”为关键词字段,作用是对全文的关键词进行检索,包括专利文献中的所有文字,“ICL/”表示国际分类,用于对国际分类号进行检索。分别采用检索式“R/cn106253701 AND B/(IGBT OR 功率)”和“R/cn106253701 AND ICL/H02M1”进行检索,从检索结果看到,目标文献分别提到了第6屏和第4屏的位置。
从功能角度对检索要素进行提取:在上述IGBT功率模块的结构中,主要器件除了IGBT之外是散热器,即模块的主要功能是提供IGBT功率器件的散热。根据上述功能提取到关键词“散热”或“冷却”。同样查找是否有符合上述功能的分类号,通过查找分类表发现,H05K7/00大组下,有相关的分类号,即:
(1)H05K7/00:对各种不同类型电设备通用的结构零部件。
(2)H05K7/20:便于冷却、通风或加热的改进。
其中,H05K7/20包括对电设备的零部件进行冷却的结构,是符合上述散热功能的分类号。此处仍然选用关键词字段“B/”和分类号字段“ICL/”进行人工干预。分别采用检索式“R/cn106253701 AND B/(散热OR冷却)”和“R/cn106253701 AND ICL/H05K7/20”进行检索,结果显示,两种干预方式均将目标文献提到了第5屏的位置,其中,采用分类号干预的方式位置更加靠前一些。
为了使得检索结果的命中率更加精准,通过对技术方案进行分析,根据发明点来提取关键词进行检索。通过对权利要求1的方案进行分析,并结合说明书的记载“本发明由至少两个IGBT功率模块并联成IGBT功率模块组,并对称分布在散热器两侧,在同样的面积内,增加功率密度,降低功率模块的制作成本,同时,对称的设置可以避免IGBT模块不均流”,可以得到本申请主要通过将IGBT模块中的各器件以散热器为中心对称排布,从而实现了功率密度的提高。根据其中的“以散热器为中心对称排布”,提取关键词“中心”“对称”和“镜像”,采用检索式“R/cn106253701 AND B/(中心OR对称OR镜像)”进行检索,目标文献进一步提到了第2屏结尾处的位置。
由于关键词字段“B/”是对全文关键词进行检索,可能导致检索结果范围过大。尝试采用组合检索字段“A/”(其中包括了标题或摘要或权利要求中含有的关键词)和权利要求字段“ACLM”进行检索,以缩小检索结果范围。分别采用“R/cn106253701 AND A/(中心OR对称OR镜像)”和“R/cn106253701 AND ACLM/(中心OR对称OR镜像)”进行检索,相对于上一步用“B/”关键词检索字段进行检索,目标文献均提到了第2屏靠前的位置。也就是说,基本上浏览30篇以内的文献便可以找到目标文献。 在逻辑算符的选取上,常见的“AND”和“OR”算符,往往难以限定出较为具体并高度相关的检索要素。Patentics同样提供了其他逻辑算符可供使用。比如邻近算符:“adj/”为区分位置的邻近算符,如散热器和对称间相距小于等于5个字:用b/“散热器 adj/5 对称”,检索结果中散热器位置在对称之前;“adjn/”为不区分位置的邻近算符,如散热器和对称间相距小于等于5个字:用b/“散热器 adjn/5 对称”,散热器和对称的位置可以互换,检索结果中二者的前后位置不作区分。注意,仅支持两个词的邻近运算,并且邻近算符需在双引号中使用。具体到本案例,在上述对于发明点的分析来进一步提取检索要素,由于“本申请主要通过将IGBT模块中的各器件以散热器为中心对称排布”,因此,采用邻近算符“adjn”来构建新的人工干预检索式,分别采用检索式“R/cn106253701 AND B/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”和“R/cn106253701 AND ACLM/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”进行检索,检索结果的位置均得到了大幅提升,其中,采用检索式“R/cn106253701 AND ACLM/”(散热OR冷却)adjn/10(中心OR对称OR镜像)”进行检索,目标文献位于检索结果的第10篇,大大提高了检索效率。
2 结语
Patentics系统提供了丰富的检索字段,根据不同的字段特点能够实现不同方面的人工干预。一定程度上弥补了Patentics语义检索中,由于不能有效提取发明构思以及无法使用精确分类,导致检索范围过大的缺点。
在采用人工干預方式的具体应用中,通常情况下,对于具有相对准确分类号的某些技术特征,采用分类号进行干预的检索结果要比采用关键词的结果更优;在标题、摘要和权利要求中的检索结果要比在全文中进行检索的结果更优。但同时也可能导致遗漏某些目标文献。
灵活运用模糊、邻近词语检索等逻辑算符构建检索式,Patentics提供了许多其他类型的逻辑算符,如“adj/”“adjn/”“equ/”等,相对于“AND”与运算和“OR”或运算算符,在检索结果范围过大时,采用这些邻近算符能够构建出更加合理的检索式,从而大大提高检索效率。
[参考文献]
[1]容淦,张晓冬,胡玉连.Patentics的不同干预方式在玻璃领域的检索应用研究[J].图书情报导刊,2017(2):68-78.
Retrieval application of artificial intervention with different retrieval fields of patentics
Ding Ran
(Beijing Center for Patent Examination, State Intellectual Property Office, Beijing 100071, China)
Abstract:The method proposed in this paper provides a wealth of retrieval fields for Patentics system, coupled with all kinds of wildcards, ambiguity, nearest neighbor word retrieval and logical operation, so that retrieval personnel can combine different intervention methods when they manually intervene in semantic retrieval results, so as to obtain better retrieval results.
Key words:Patentics; retrieval field; manual intervention