思博网

善用技能承载价值体现,专利检索方法浅谈

来源:思博网     发布时间:2017-03-27     点击量:
(本文转载于思博网,如有侵权,请联系删除)
专 利 检 索 方 法

      专利检索,顾名思义,即从众多的专利文献中检索并筛选出满足特定条件的专利文献。无论是基于专利的行业分析,还是专利申请之前的查新,或者专利的稳定性分析,都离不开专利检索。专利检索是上述工作中所需资料的唯一来源,起到基础性作用。可以说,专利检索是专利分析的基石,也是专利分析工作人员的基本功。

专利检索的分类
表1 专利性检索和技术领域检索区别
WechatIMG1192.jpeg
需要强调的是,上述两类检索的要求不同:
*对于可专利性检索,只要找到对比文件即可,对准确性的要求更高。
*对于技术领域检索,就要从更深的层次上理解“准”和“全”的关系:“准”和“全”是两个相互矛盾的概念,关键在于找到平衡。
      如果过度追求查全,就必然引入大量噪音,准确性就下降了;反之,如果过度追求查准,就会造成大量遗漏,丧失了全面性。因此对于技术领域的检索,关键在于找到二者之间的平衡,使准确性和全面性在可控的范围内。追求完全的准确而无遗漏,即不现实,也无必要。而一般认为,查全率和查准率要至少达到80%+,最好能够达到90%+。

主要以技术领域检索为例
介绍一下专利检索的流程

一、技术调研,界定技术领域的范围
      例如,要对客户提出的“半固态压铸技术”进行检索,就要通过与客户沟通,网络资料搜集等方式明确“半固态压铸技术”的内涵和外延。作为专利分析工作者,不必对技术的细节、原理等进行深入的了解。但技术调研至少应做到以下几点:
● 了解这一技术领域有哪些上位概念;
● 梳理这一技术领域都有哪些分支及各分支之间的区别;
● 了解与“半固态压铸”相似但不同的概念有哪些及其区别特征;
● 在这一领域重要申请人有哪些,等等。
在该阶段应达到的目的是了解该技术的框架,要做到能迅速鉴别某篇专利是否属于这一技术领域。

二、制作技术分解表
2 技术分解表
WechatIMG1193.jpeg
其中,“行”表示分解要素
“列”表示关键词和分类号
      例如,“半固态压铸技术”可以分解为“半固态”和“压铸”两个分解要素,将其分别填入到分解要素1和分解要素2的位置。①中填写半固态相关的关键词,②中填写压铸相关的关键词。

关键词的设置

关键词要包含同近义词、上位词、下位词、
别名、缩写、单复数、甚至常见错误。
      由于涉及的种类较多,为了避免遗漏,可以在技术分解表关键词一栏的后面备注要查找的内容(见上表),如果已经收集了这些内容,就将相应内容颜色替换,如果没有,就保留白色提醒自己去做。
关键词的查找主要有以下6步:
1、百度搜索,得关键词Ⅰ
2、学术文献检索,得关键词Ⅱ
3、将关键词Ⅰ和关键词Ⅱ简单组合,在专利数据检索平台简单检索,在检索到的专利信息中进一步筛选,得到关键词Ⅲ
4、在步骤3得到的专利信息中选出部分有代表性的专利,在中国及多国专利审查信息查询http://cpquery.sipo.gov.cn/网站查询专利审查时审查员检索该专利所用的关键词,得到关键词Ⅳ
5、将关键词Ⅰ、Ⅱ、Ⅲ、Ⅳ和分类号相结合,构建检索式并下载著录项,浏览著录项的过程中很可能发现新的关键词,得到关键词Ⅴ
6、将关键词Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ合并,即可得到最终的关键词

分类号的确定

分类号在检索中有两种常用方法:
1. 分别查找每个分解要素的分类号,分别填入到③和④的位置。
2.查找整个技术领域的分类号,填入到⑤的位置。
这两种方法中分类号限定作用的强弱有所不同:
      方法1中分类号起精确限定作用,分类号起到与关键词类似的作用,可以替代关键词使用,需要将分类号精确到小组级别,如A01M 59/00,要保证分类号查找的细致与全面。
      方法2中分类号起初步限定作用,而关键词在分类号的基础上做进一步限定,一般仅将分类号限定到小类,如A01M。对于“半固态压铸技术”这一领域,“半固态”这一分解要素难以找到明确的分类号,可选取方法2,仅用分类号对技术领域进行初步限定。
分类号可以从以下3个途径查找:
1、从IPC分类表直接查找分类号。如果对IPC分类表非常熟悉,可以直接翻看IPC分类表,确定技术领域所属的分类。
2、通过关键词查找IPC分类号。在“soopat”、“润桐”等专利数据检索平台IPC分类号查询一栏中输入关键词,从检索出的分类号进一步筛选,得到技术领域所属的分类。
3、将关键词查找步骤中得到的关键词Ⅰ和关键词Ⅱ简单组合,在专利数据检索平台进行简单检索,从检索结果的分类号信息中筛选出所属技术领域的分类号。
关键词检索时各步骤需要按顺序操作,环环相扣,而在分类号查找时,上述三个途径择一即可。途径2局限性较大,经常无法检索出需要的信息,因此推荐采用途径1和途径3。
采用以上方法,可得到“半固态压铸技术”的技术分解表。


3 半固态压铸技术分解表
WechatIMG1194.jpeg

三、构建检索式
      检索式构建思路:不同分解要素之间用and连接,分解要素内部用or连接,如对于“半固态压铸”,检索式可构建为:
      全文=((半固态 or 半凝固 or 半熔融 or 半固体 or 流变 or 触变) and (压铸 or 压力铸 or 压射 or 注射 or 射铸)) and IPC=(B22 OR C22 OR F15B OR B23P OR B21C OR C21C OR B21J OR C21D)(1)
      如果采用分类号的精确限定,检索式也可构建为:(① or ③) and (② or ④)(其中的标号见表2),此时,分类号起到与关键词相同的限定作用。
补充:
通用逻辑运算符:
and:表示“与”
or:表示“或”
not:表示“非”
      三者的运算先后顺序为:not>and>or,构建检索式要注意用括号进一步限定运算顺序,如A and B or C和A and (B or C),所表示的含义完全不同,二者先运算的部分分别是A and B和(B or C)。
      需要提醒一点:在检索式的构建时尽量避免用not作为逻辑词,因为not掉某个词之后,凡是包含这个词的专利文献就都被去掉了,其中必然包含大量有用信息。如:检索”流变”(“流变”是一种压铸工艺)一词,会出现很多包含“电流变化”的专利文献,但如果用not作为逻辑词,用流变 not 电流变化作为检索式进行检索,则同时包含“流变”和“电流变化”这两个词的专利文献也一并被去掉了,这显然不是我们希望的结果,因此在检索式构建时要慎用not。
      特定专利数据检索平台的逻辑运算符:(以智慧芽为例,各平台的运算符不同,其他平台的特定运算符在这里不做总结)
①“”:精确查找,常用于英文词组查找。
②$PREn:前后检索项之间顺序不变,可间隔0~n个单词或中文字
如(挤压 $PRE2 铸造)可检出挤压压铸铸造
③$Wn:前后检索项之间顺序可变,可间隔0~n个单词或中文字
如(高清$W2电视)表示高清和电视之间隔了两个字
④$Ws:限定在一句话内,且在100个字符(50个中文字)以内
如(高清$Ws电视)表示高清和电视包含在同一句话内
注:$PREn,$Wn,$Ws支持10个以内符号连用
⑤通配符:常用于英文检索
     ?:表示1个字符
      如,sm?th—smith,smyth
      ????oxide—monooxide,hydroxide,pentoxide
      *:表示0或多个字符
      如,Cataly*—catalyst,catalysis,catalyzer

四、检索结果初判
      对于有多年检索经验的专利分析人员,已经建立了对各领域的专利数量的感性认知,仅凭借直觉就可以判断自己的检索数量是否复合行业情况,如果检索数量太少,就应该先扩大检索范围,通过更大范围的浏览,寻找补充关键词。如果检索数量过大,说明噪音很多,就应该寻找噪音源,通过合理的策略去噪,对检索式做出调整。

五、去噪
      去噪策略主要分为批量去噪和逐篇去噪两种。
      去噪,是通过调整分类号和关键词达到去噪的目的,或对著录项进行批量删减去噪。如,采用检索式全文=((半固态 or 半凝固 or半熔融 or半固体 or 流变 or 触变) and (压铸 or 压力铸 or 压射 or 注射 or 射铸)) and 分类号进行检索时,发现结果中出现大量医学领域的专利,这些专利都包含有“血流变化”和“注射”两个词,就可以将“流变”和“注射”单独检索,看看结果中噪声的多少,如果噪声过多而有用专利很少,就可以考虑删除或替换相关关键词。也可以看看是否分类号选择不恰当导致领域限制不清,尝试对分类号进行调整。检索式的设置不可能见善尽美,一定是存在噪音的,有些噪音无法通过检索式去除,只能下载著录项之后批量去除,去噪的思路是“先减后加”。依然采用“流变”和“电流变化”举例,如果想去掉仅包含“电流变化”的而不包含“流变”的词,可以先减——先将包含“电流变化”这一关键词的所有著录项筛选出来,一并去掉,后加——在筛选出来的著录项中采用除“流变“以外的其他关键词,提取出与压铸相关的专利再补回去。
      逐篇去噪,通过人工逐篇浏览进行去噪,这种方式效率低,但这是批量去噪的补充,也是专利分析人员必不可少的工作,需要极大的耐心。

六、检索结果验证
      对于大型专利检索工作,需要进行专利检索结果的验证,验证指标是查全率和查准率。一般而言,中文检索的查全率和查准率要保持在90%+,英文要保持在80%+。
      其中,P为检索结果,S为样本库。样本库中被检索结果所包含的数量与样本库数量的比值,即为查全率。
样本库的构建要遵循以下几点:
1、需要采用与检索过程不同的方式获得。
如,检索结果P是采用检索式(1)得到的,则样本库S的构建不能采用同样的检索式。可以基于重要申请人/发明人或采用不同的检索方法或检索工具构建样本库S。
2、样本库S中的每篇专利都必须与技术领域极其相关,不能有噪音
3、样本库S应当具有足够数量的专利,一般为检索结果P的10%。

查准率用抽样法评估。抽样样本去掉噪音之后的数量与样本总数量的比值即为查准率。

      专利检索虽然很基础,但想要做好并不容易,需要极其有耐心,一个检索式的设置常常需要经过十几次、甚至几十次的调整。但它却很重要,只有保证误差在可接受的范围之内,才能避免由于误差的放大效应造成的对最终报告结论的影响。因此,每一次检索都值得我们做好。

文章来源:企兴知识产权  作者:刘在强  转载请注明出处



查看原文   电话咨询:13544847908   QQ咨询:1176391287

思博网

上一篇:苹果在中国获得重大胜诉,专利侵权案被推翻

下一篇:实务 | 对专利民事侵权纠纷中几种特殊侵权类型的探究

友情链接 :东莞政府 东莞市科技局 东莞市工信局 东莞市商务局 广东省科技厅 广东省工信委 广东省商务厅 东莞市知识产权局 知识产权局 商标局
备案号 :粤ICP备17125350号
亿鸽在线客服系统