記事・コラム

記事・コラム

特許調査の専門家が教える「検索式作成」の考え方【初心者向け】

特許検索式の作成法

1.はじめに

これまで下記2つのコラムにおいて、特許調査(特許検索)における両輪である「特許分類」と「キーワード」の選び方の基本について説明しました。

今回は、これらを組み合わせて検索式を構築するための実践的な手順を解説します。
闇雲に検索を始めるのではなく、論理的なステップを踏むことが、効率的な調査への近道です。

なお、特許検索のアプローチや検索式の組み立て方は、使用するデータベース、対象技術、調査のリスク許容度、所属組織や調査担当者の方針などによってさまざまです。
本稿では、その一例として、筆者が実務上意識している検索式作成のポイントをご紹介します。

2.調査目的の明確化

検索式を立てる前に最も重要なのは、調査の目的を明確にしておくことです。
目的が変われば、目指すべき母集団(検索結果の集合)の性質も大きく変わります

例えば、侵害予防調査(FTO調査・クリアランス調査)においては、漏れが大きなリスクにつながる調査であるため、多少ノイズが増えても、網羅性を重視した検索式設計が求められます。
複数の分類や同義語を駆使するだけではなく、上位概念についても意識して検索式を検討する必要があります。一方で、実施の上で障害となり得る「生存している特許」(権利が有効な登録特許や、今後登録される可能性のある公開段階の特許)を調査すればよいため、拒絶確定・満了・放棄等により権利化・権利維持の可能性がなくなった案件については母集団から除外することが一般的であり、結果として件数を絞り込みやすくなるという特徴もあります。

その他の調査に目を向けると、無効資料調査では「明細書のどこかに記載があればよい」という考え方から、名称・要約・請求の範囲といった主要部分だけでなく、公報の「全文」を検索範囲とすることが望ましいと言えます。
また、出願前調査では、主にコスト面との兼ね合いから、網羅性よりも効率を重視する場合があります。例えば、まずは自社の発明と同一または類似する先行技術の有無を短時間で把握したい場合には、コアとなる技術要素に絞って検索することも有効です。

3.調査計画の必要性

調査目的が明確になったところで、実際の調査計画を作成します。
一般的に、母集団を大きくすればするほど調査漏れのリスクは低減しますが、調査に要する時間・コストは増大します。
時間をかけて徹底的に調査するのか、短時間でコアな部分に絞って調査するのか。こうした方針を事前に決めておかなければ、適正な検索式は作成できません。

実際に検索式を作ってみなくては最終的な母集団規模は分からない場合も多いですが、調査目的によっては、あらかじめ「100件以下に抑える必要があるのか」「1,000件程度を目安にするのか」「2,000件以上の件数でも許容するのか」といった、おおよその目標規模を決めておく必要があります。

4.検索式の作り方:実践的な組み立て手順

準備が整ったら、いよいよ実際に特許分類やキーワードを組み合わせて検索式を作成していきます。
以下では、筆者が検索式を組み立てる際に意識している、検索漏れを防ぎつつ精度を高めるための実践的なポイントを解説します。

(1)特許分類で「技術分野」を規定する

検索式を組み立てる際、筆者がまず行うのは「特許分類(FIやFターム)を使って技術分野を決めること」です。

よくある失敗として、最初からキーワードだけで検索式を作ってしまうケースが挙げられます。しかし、キーワードだけに頼ると、例えば「シート」という単語で検索した際に、自分が調べたい「自動車の座席(シート)」だけでなく、「樹脂製の薄い板(シート)」や「寝具・生活用品としてのシート」など、全く異なる分野の膨大なノイズが混入してしまいます。

まずは特許分類を用いて「今回は自動車の座席の分野を調べる」という正しい技術分野を定義することで、無関係な分野のノイズを大幅に減らすことが可能です。

(2)特許分類のみによる検索

ベースとなる分野を特許分類で規定した後、通常はキーワードを掛け合わせて絞り込みを行いますが、あえて「特許分類だけ」で検索・確認する手法が有効な場合もあります。特に、日本の特許分類であるFIは比較的信頼度が高く、技術分野を絞り込むうえで有力な検索軸になります。もっとも、分類付与のばらつきや付与漏れが生じる可能性もあるため、キーワード検索と併用しながら活用することが重要です。

① FIによる全件確認

日本のFI(ファイルインデックス)は、技術の具体的な特徴点に応じて細分化されています。そのため、自分の調べたい技術にピンポイントで合致するFIが存在する場合、まずはその分類だけで検索してみましょう。もしヒット件数が数十件から数百件程度で、目視確認が可能な範囲であれば、あえてキーワードで絞り込む必要はありません。「そのFIが付与された公報を全件目視で確認する」のが、キーワードの言語的な揺れによる検索漏れを防ぐ最も安全なアプローチになります。

② Fタームを駆使した多角的なアプローチ

Fタームは、FIとはまた異なる「目的」「構造」「材料」「制御」といった多角的な視点から、技術を横断的に分析して付与されている分類です。
ここで実務上知っておくべきFタームの特徴は、必ずしも主たる発明のポイントだけでなく、テーマや観点によっては、構成要素・用途・材料・作用などの側面からも付与される場合があるという点です。

この特徴を活かし、例えば「[構造のFターム] × [材料のFターム]」といったように、異なる観点のFターム同士をAND検索で掛け合わせる手法も有効です。キーワードを使わずとも、分類の掛け合わせだけでノイズを効果的に落とし、適正な件数の母集団を効率よく作成できる場合もあります。
ただし、公報にFタームが付与されていなければ検索漏れにつながります。また、Fタームが十分に整備されていない技術テーマもあります。そのため、Fタームのみに頼ることは避け、キーワードを用いた検索も行いましょう。

(3)特許分類×キーワードの掛け合わせの注意点

① 件数を確認しながら限定項目を増やす(基本)

特許分類だけでは件数が多すぎる場合、ここから「特許分類 × キーワード」の掛け合わせ(AND検索)を行っていきます。これは、実務における検索式の作り方の最も基本となる形です。

このときのコツは、最初から条件を厳しくしすぎないことです。まずは「特許分類 × 必須のキーワード(要素A)」で一度検索を実行し、ヒット件数を確認します。その結果、想定した母集団件数を超えているようであれば、さらに「別の要素のキーワード(要素B)」をANDで掛け合わせる、というように段階的に限定項目を増やしていくのが基本的なアプローチです。

② キーワード検索の対象範囲(主要部分か全文か)

また、この件数調整においてキーワードの追加と同じくらい重要なのが、「検索範囲(主要部分か全文か)」のコントロールです。

主要部分(「発明の名称+要約+請求の範囲」など)での検索

件数を現実的な規模に一気に絞り込みたい場合に有効です。特に侵害予防調査(FTO調査・クリアランス調査)では、実際の権利範囲は請求の範囲(クレーム)をベースに判断されます。そのため、まずは請求の範囲を含む主要部分を対象に検索し、権利範囲に関係し得る文献を効率よく抽出することが有効です。ただし、具体的な構成が明細書中にのみ記載されている場合や、請求の範囲の解釈に明細書の記載が関係する場合もあるため、全文検索を併用するかどうかは、調査目的と件数を見ながら判断します。

全文検索

一方で、「無効資料調査」や「出願前調査」においては、基本的には公報全文を検索範囲とすることが推奨されます。これらの調査で重要なのは「その技術がすでに公知かどうか」だからです。たとえ主要部分に書かれていなくても、実施例や背景技術に記載があるだけで証拠になり得ます。ただし、全文検索はヒット件数が爆発しやすいため、その分掛け合わせるキーワード自体をより具体的なものに絞り込んでいく必要があります。

③ 単一の式での検索漏れのリスクについて

実務上のポイントとして「一つの検索式(ANDの1行)だけで完璧に絞り込もうとすると、どうしても検索漏れが発生してしまうリスクが高まる」という点に注意が必要です。
特許公報の表現は多様です。検索用に用いた限定項目のうち、たった一つでも「検索式に用いていない想定外のキーワード」が使われていたり、「分類付与のばらつき・付与漏れ」があったりするだけで、その公報は検索結果に一切引っかからなくなってしまいます。特に、母集団を絞り込もうとして限定項目を増やしていけばいくほど、そのリスクは高まっていきます。

この検索漏れをできる限り少なくするためには、「検索キーワードの選び方」のコラムでも触れたように「同義語・類義語をできる限り幅広く検討すること」が極めて重要です。また、件数を減らしたいからといって、キーワードによる限定条件を何重にもANDで掛け合わせることは、慎重に判断すべきです。

検索式を作成する際は、途中式での母集団件数も観察しながら行うことが重要です。
もし、あるキーワード群を追加しても件数がほとんど減らないのであれば、そのキーワード群は絞り込み条件としての効果が小さいと考えられます。それにもかかわらずAND条件として追加してしまうと、公報内でたまたま別の表現が使われているだけで、関連性の高い文献を検索結果から落としてしまうリスクがあります。そのため、絞り込み効果が小さいキーワード群については、あえて検索式には組み込まないという判断も必要です。

④ 複数の「AND式」を「OR」で併用する

こうした「限定していくことによる漏れ」を、キーワードの工夫だけで完全に防ぐのは限界があります。そこでよく使われる手段が、「異なる切り口で作成した複数のAND式を、最終的にOR(和集合)検索で併用する」という手法です。

一つの検索式だけを厳しく絞り込むのではなく、切り口の異なる検索式を複数用意し、それらを重ね合わせるイメージです。Aというキーワードが抜けていても、別の切り口の式がカバーしていれば、最終的な母集団にその公報を救い上げることができます。

(4)複数式(OR検索)の具体例とバリエーション

複数のAND式をOR検索で併用すると言っても、闇雲に式を作ればよいわけではありません。
ここでは、筆者が実務でよく用いる、切り口の異なる検索式のバリエーションをご紹介します。

① 構成要素(限定要素)の組み合わせを工夫する

調べたい発明に「大前提となる構成要素A」があり、さらにそこに「特徴的な要素B、C、D」が含まれるとします。このとき、件数を減らしたいからといって「A×B×C×D」とすべての要素をANDでつないでしまうと、前述の通り検索漏れのリスクが上がります。
そこで、例えば「A×B×C」「A×B×D」「A×C×D」という式をそれぞれ作り、これらをORで足し合わせる((A×B×C)+(A×B×D)+(A×C×D))といった工夫をします。これにより、要素Cに対応する表現が想定したキーワードで記載されていない場合でも、要素Cを含まない別の式、例えば「A×B×D」によってヒットさせられる可能性があります。

ここでどのような組み合わせとするかは、構成要素の重要性などを踏まえて選びましょう。上記の例では、「大前提Aと同程度の重要性の特徴点B、C、D」を想定し、「B、C、D」のそれぞれの組み合わせをすべて検索して並列させています。もし「特徴点B、C、D」のうち、特徴点Bの重要性が特に高いのであれば、((A×B×C)+(A×B×D))としてもよいでしょう。

どこまで構成要素を分解して検索式のバリエーションを増やすかは、結局のところ「件数次第」です。実際の調査の都合上(限られた時間やコスト、人員など)、限定をきつくしてでも母集団をコンパクトに絞り込まなければならないケースも多く存在します。
だからこそ、検索式を作る前の段階で「今回は実際の調査の都合上、母集団をどの程度の想定件数に収める必要があるのか」という大体の目標値をあらかじめ決めておくことが極めて重要なのです。この事前の想定があるからこそ、リスクを取ってでも絞り込むべきか、あるいは複数の式をOR検索でつないで網羅性を重視するか、という実務的な判断を行いやすくなります。

② 「深さと広さ」を併用する

特許分類の階層の深さと、キーワード(KW)による限定の厳しさを反比例させて組み合わせる手法です。分類の広さとキーワード条件の厳しさが異なる式を併用します。

  • 式①(広×狭):「広い範囲(上位)の特許分類」 × 「狭いKW(後述の近傍検索など)」
  • 式②(広×多):「広い範囲(上位)の特許分類」 × 「KW × KW(限定する行・回数を増やす)」
  • 式③(狭×緩):「狭い範囲(ピンポイント)の特許分類」 × 「KW(限定は少なめ)」

上位階層の広い分類を用いつつもキーワードを厳しく絞り込んだ式(①、②)と、分類自体がピンポイントなのでキーワードを緩めた式(③)を混ぜ合わせることで、分類付与のブレと言葉の揺れの双方をカバーした頑強な母集団が作れます。

また、キーワードの検索範囲を主要部分に限定したものと、全文検索を組み合わせることも有効です。

  • 式④(主要部分):「特許分類」 × 「主要部分のみのKW検索」
  • 式⑤(全文×全文):「特許分類」 × 「全文KW検索」×「全文KW検索」

いずれにせよ、一つのAND検索だけではなく、複数の検索結果をOR検索することで網羅性を高めることが重要です。

③ 役割を入れ替える

調査対象の技術について、例えば「モノ(製品種別)」と「素材・製法」の双方に適切な特許分類が存在する場合、それぞれの役割を入れ替えた式を併用します。

  • パターンX:「モノとしての特許分類」 × 「特徴的な部分(素材・製法等)のKW」
  • パターンY:「素材・製法としての特許分類」 × 「対象物(モノ)に関するKW」

ある公報が「製品」の観点で分類されるか、「材料・プロセス」の観点で分類されるかは、ケースバイケースです。この役割の入れ替えを行うことで、どちらの視点から分類された公報であっても漏らさずヒットさせることができます。

④ 近傍検索による具体的な構成・動作の指定

単純なAND検索(単語Aと単語Bの両方が公報に含まれること)では、離れた位置にある無関係な単語同士がたまたまヒットしてしまうことが少なくありません。これを防ぐために有効なのが、単語同士の間隔を指定する「近傍検索」(近接演算)です。
近傍検索を活用すると、以下のような特許特有の具体的な表現を高精度に狙い撃ちすることができます。

  • 具体的な構成の明確化:「〇〇(用途)用の ●●(部材)」
  • 動作・プロセスの指定:「〇〇 を ●●(動詞)する」
  • 特徴の指定:「〇〇な ●●(部材)」

単語同士が近くに記載されている(例:5文字以内、10文字以内など)ということは、それらが密接な関係性を持って記述されている可能性が高いです。近傍検索を使いこなすことで、ノイズを大幅に減らし、目的の構成や動作に関する公報を効率よく抽出できます。

⑤ 「単位キーワード」と近傍検索の掛け合わせによる技術要素の特定

キーワード検索の隠れたテクニックとして、「単位(cm²、kg、℃、Vなど)」を検索キーワードに指定することも有効です。特許公報において特定の単位が記載されているということは、その周辺で「特定の技術要素(パラメータ)」について規定されていることを意味します。

  • 「cm2、cm^2(平方センチメートル)」があれば、面積に関する規定が含まれている可能性がある
  • 「μm(マイクロメートル)」があれば、膜厚や粒径などの微細な寸法に関する記載が含まれている可能性がある
  • 「℃」があれば、加熱・冷却などの温度条件に関する記載が含まれている可能性がある

ただし、単位はアルファベット1〜2文字であることも多いため、単純にキーワード検索(AND検索)してしまうと、無関係な単語の一部や型番などに引っかかり、膨大なノイズを拾ってしまいます。そこで、前述の「近傍検索」と組み合わせるとノイズを大きく減らせます。

例えば、「高温での焼成」が特徴の発明を調べたい場合、単純に「焼成 AND (温度 OR 高温)」と検索すると、「温度」「高温」という言葉を使わずに「1000℃以上で焼成する」とだけ書かれた重要な公報を漏らすリスクがあります。しかし、ここで「焼成」と「℃」や「度」を近傍検索で指定して縛ることで、具体的な処理温度に直接言及している箇所をピンポイントに狙い撃ちすることができます。
ベースとなる「焼成 AND (温度 OR 高温)」という検索に、この「単位を用いた近傍検索」の結果をORで組み合わせることで、さらに網羅性を高めることができます。

なお、使用するデータベースによってはアルファベット1文字での近傍検索や記号の検索に対応していない場合もありますので、事前に各データベースのマニュアルをご確認ください。

⑥ 「NOT検索」のリスク

件数を減らすための手段として、特定の単語を除外する「NOT検索」(例:単語A NOT 単語B)がありますが、実務においては安易にNOT検索で限定を行うことはお勧めしません。NOT検索は、その単語が公報内のどこか一か所にでも記載されていれば、公報全体を丸ごと検索結果から排除してしまうため、検索漏れのリスクが極めて大きいからです。

調査対象技術が「●●ではない点」が大きな特徴であったとしても、公報内の従来技術の引き合いや「〜しないため」という文脈で除外したいキーワードが使われているケースは多々あります。例えば、公報内に以下のような表現があった場合、その重要な公報はすべて除外されてしまいます。

  • 「従来技術としては通常は●●であったが、今回の発明は……」
  • 「●●を使用しないで、〇〇をするために……」

また、検索範囲を請求の範囲のみとする場合であっても、「●●を何ppm以下にする」「●●を積極的に取り除く」といった表現で権利範囲を規定することも珍しくありません。
特に、他社が広い権利範囲(上位概念)を押さえているリスクを自ら遮断してしまうため、侵害予防調査(クリアランス調査)でのNOT検索は極めて危険です。

そのため、筆者が実務でNOT検索を使用する際は、検索範囲をごく狭く限定するようにしています。具体的には、検索範囲を「発明の名称」に限定し、それ以外の検索範囲ではNOT検索を使わないというルールを課しています。これなら、明細書中の従来技術の文脈などによって、意図せず重要文献を除外してしまうリスクを抑えられます。

また、除外するキーワード自体も、「車」のような短い単語だと「歯車」や「風車」など意図しない単語まで巻き込んで除外してしまうため、「自動車」や「四輪車」といったできる限り長めのキーワードを指定することで、過剰な除外リスクを回避するようにしています。場合によっては、近傍検索を用いて「自動車用〇〇」といった名称の案件のみを除外するなども検討します。

5.おわりに

本稿では、特許調査における検索式の作り方について、筆者が実務上注意しているポイントを中心に解説しました。
特許調査の検索式づくりは、ただ機械的に単語を組み合わせる作業ではありません。

  • 調査目的に応じて、目指すべき母集団の規模を想定すること
  • 特許分類で正しい技術分野を規定すること
  • 検索範囲の設定や近傍検索を適切に活用すること
  • 一つの式に頼らず、複数のAND式をOR検索で重ね合わせること

これらのポイントをしっかりと押さえることで、「検索漏れを最小化し、かつ現実的に調査可能な適正件数の母集団」を構築することができます。
闇雲に検索を始める前に、ぜひ今回のステップを意識して「調査の設計図」を描いてみてください。

(日本アイアール株式会社 特許調査部 T・I)