記事・コラム

記事・コラム

生成AIで特許調査はどこまでできる?化学系調査・スクリーニング編

生成AIで特許調査はどこまでできる(化学系・スクリーニング)

従来の特許調査は膨大な特許データベースを対象に検索・抽出・分析を行うため、多大な時間と人的コストを要していました。生成AIを活用することで、調査効率を大幅に向上させ、特許戦略や研究開発の意思決定に役立てることが期待されています。

特許調査業務の効率化に資する例として、特許公報に開示された発明をより理解しやすいように要約させたり、検索式に使う特許分類(FI・Fタームなど)やキーワードを提案させたりするといった活用方法は比較的わかりやすい例といえるでしょう。しかし、スクリーニングの工程(特許公報の抽出・ノイズの除去)に生成AIをどこまで利用できるかについては、まだ多くの情報がありません。

本記事では、化学分野の無効資料調査(仮想事例)を題材にして、実際に生成AIを用いたスクリーニングの試行結果の一例を紹介し、その有効性と課題について考察します。

なお、この記事は2025年10月時点における試行結果を記載しています。生成AIに関する技術・サービスの進化スピードは速いため、記事をご覧になっている時期によっては、作成時と状況が大きく変わっている可能性があります。予めご了承ください。

1. 生成AIモデル

まず、調査に使う生成AIモデルを選定します。生成AIはChatGPTやGemini、Claudeなど複数のモデルがあり、それぞれに長所と短所があります。そのため、技術内容や調査の目的に応じて使い分けることが重要です。
例えば、ChatGPTは自然な文章生成に優れていますが、数値計算や統計処理を行う場合は外部ツールとの連携が必要とされています。また、GeminiはGoogleの検索エンジン上の最新情報を参照して回答できますが(ChatGPTは特定時点までの学習データに基づいて応答)、検索情報が存在しない領域での深い推論についてはChatGPTの方が優れているという声もあるようです。

今回は、生成AI機能を搭載した特許調査ツール(特許調査データベース)を用いて試行を行いました。(※特許調査ツールベンダ様の了承を得て掲載しております。)

読み込ませる範囲を「名称(タイトル)」「要約」「請求項」「明細書」に設定し、AIモデルとしてGPT-5(推論の深さ:low)を使用しました。
これにより、各文献中に調査対象特許(仮想)の内容が開示されているかどうかを判定しました。

2.プロンプト作成

次に、生成AIに与える指示(いわゆる「プロンプト」)を作成します。プロンプトはAIの出力品質や方向性を左右する重要な要素です。

出力結果(AIの応答)の品質や方向性は、プロンプトの内容次第で大きく変わります。AIは膨大なデータから学習していますが、抽象的な指示(例:「良い感じにまとめて」など)をユーザーの意図通りに解釈したり、暗黙の了解 (例:明文化されていない「業界内の常識」や「文脈上当然わかること」など)を補うことは苦手とされています。精度や再現性を重視する場合、このような曖昧な指示は避ける必要があります。

下記のようにプロンプトを作成し、設定画面に入力しました。

調査母集団の特許文献を3つの観点で判定するよう指示しています。

プロンプト内容(例)

あなたは特許調査の専門家です。
下記の特許に係る請求項の内容が開示された特許文献を収集し、当該特許の無効化を図っています。


【請求項】

接着層をシート支持体上に備える接着シートであって、
前記接着層は、接着性ポリウレタンと、該接着性ポリマー100重量部に対して0.5~17重量部のアザシクロプロパン系架橋剤、から生成される架橋化合物を含み、
前記接着性ポリウレタンは、二官能イソシアネートと、炭素数3~12のアルキレングリコール及びヘキサン二酸を縮合させたグリコール、を反応させてなるポリマー前駆体を、二価アミンで伸長させたポリウレタンである、接着シート。


明細書を分析し、対象特許の特徴や構成が開示されているかを以下のルールに従って判定してください。
また、その判定結果の根拠について分析した文献内の記載を引用して説明してください。


【接着シート】明細書に「接着層をシート支持体上に備える圧着シート」が開示されている場合は1、開示されていない場合は、0 を判定として出力してください。その判定結果の根拠も分析した文献内の記載を引用して説明してください。

【接着層】明細書に「接着性ポリウレタンと、該接着性ポリマー100重量部に対して0.5~17重量部のアザシクロプロパン系架橋剤」が開示されている場合は1、開示されていない場合は、0 を判定として出力してください。その判定結果の根拠も分析した文献内の記載を引用して説明してください。

【接着性ポリウレタン】明細書に「二官能イソシアネートと、炭素数3~12のアルキレングリコール及びヘキサン二酸を縮合させたグリコール、を反応させてなるポリマー前駆体を、二価アミンで伸長させたポリウレタン」が開示されている場合は1、開示されていない場合は、0 を判定として出力してください。その判定結果の根拠も分析した文献内の記載を引用して説明してください。
炭素数3~12という表記は、分子中の炭素原子の数が 3個以上12個以下であることを意味し、炭素数3、炭素数4、炭素数5、炭素数6、炭素数7、炭素数8、炭素数9、炭素数10、炭素数11、炭素数12のいずれかが含まれていれば該当します。

3.調査母集団(検索式)の作成

生成AIに読み込ませる特許公報の母集団を検討します。

今回は、シート状の接着剤に関する技術を対象に、代表的なFI分類と請求項内のキーワードを用いて簡易的な検索を行い、その結果をJ-platpatから取得して生成AIに読み込ませる母集団としました。

 [FI:C09J7/20]×[請求の範囲:ポリウレタン]×[2014年12月31日までに公知] ⇒ 772件(2025年10月1日時点) 

この772件を母集団としてスクリーニングを実施します。

母集団としてスクリーニング
母集団としてスクリーニング2

今回使用した調査ツールの生成AI機能は従量制であり、作業量に応じた料金が発生します。料金は、調査件数・プロンプト内容・文献の読み取り範囲・使用するAIモデルなどによって変動します。
実際にAIを活用する際は、いきなり大量の文献を処理するのではなく、まずは数件の予備検索を行い、プロンプトや設定内容を調整しながら最適化することをおすすめします。

4.調査結果の検討

(1)工数

772件の特許を生成AIに読み込ませたところ、合計で約18時間を要しました。
平均では、1070分/772件 ≒ 1.4分(84秒)程度かかっています。
費用は約9,000円で、1件あたり12円程度でした。

(2)判定

生成AIの判定について妥当性を確認しました。
772件中、各ラベルについて、【接着シート】が546件、【接着層】が3件、【接着性ポリウレタン】が58件、“1”(抽出)と判定されました。
【接着層】の観点(「接着性ポリウレタンと、該接着性ポリマー100重量部に対して0.5~17重量部のアザシクロプロパン系架橋剤」)での抽出が少ないので、本来は抽出(1と判定)すべきところを見逃していないか(0と判定していないか)検証しました。

下記の特開2012-017399の【接着層】の判定根拠について確認してみます。

【接着層】0

根拠: 明細書には、(i)接着樹脂としてポリウレタンを例示([0089]〜[0093])、(ii)架橋剤として多価アジリジン化合物を例示([0095])、(iii)架橋化剤の配合量として「粘着樹脂(B)100重量部に対して、0.1〜40重量部」([0096])とあります。
しかし、
– ポリウレタンと「アザシクロプロパン系架橋剤」の特定組合せを必須とする記載はなく、
– アザシクロプロパン系架橋剤量の範囲も「0.1〜40重量部」であり、「0.5〜17重量部」に特定した開示はありません。
また、実施例ではアクリル系樹脂にイソシアネート系又はエポキシ系架橋剤を用いており([0137]〜[0140])、ポリウレタン×アザシクロプロパンの具体例も記載されていません。従って、問合せ範囲の特定条件は明細書に直接開示されていないと判断します。

構成要素は正しく開示されており、明細書からの引用にも誤りはないため、判定は“1”が妥当なはずです。
しかしAIはアザシクロプロパン系架橋剤量の範囲は「0.1〜40重量部」であるから、「0.5〜17重量部」ではないと判定しています。
通常、「0.1〜40重量部」の範囲には「0.5〜17重量部」が含まれるはずですが、包含関係ではなく「0.1〜40」≠「0.5〜17」としてしまっています。

(3)プロンプト再検討

(2)であげた文献について、
【接着層】のルールに下記を追加したプロンプトに修正しました。

「0.5~17重量部」には、例えば「0.1〜40重量部」のように範囲の一部に
「0.5~17重量部」が含まれているものも該当します。

プロンプト修正後における下記の【接着層】の判定結果は、意図通りの結果となりました。

判定:1

根拠:

– 接着層を構成する粘着樹脂について「(メタ)アクリル樹脂、シリコン樹脂、及び、ポリウレタン樹脂からなる群から選ばれた少なくとも1種であることが好ましい」とあり、ポリウレタン樹脂(接着性ポリウレタン)が明示されています。
– 架橋剤について「…例えば、イソシアネート類、多価イソシアナート化合物、多価エポキシ化合物、多価アジリジン化合物、キレート化合物等が挙げられる。」とあり、アジリジン系架橋剤(アザシクロプロパン系架橋剤)が具体例として開示されています。
– 配合量について「上記架橋剤の配合量は、上記粘着樹脂(B)100重量部に対して、0.1〜40重量部が好ましく…」とあり、0.5〜17質量部はこの範囲に包含されます(指示の通り、上位範囲に含まれる場合も該当)。
– また接着層が「…帯電防止性粘着剤組成物を架橋して得られた…」とされ、粘着樹脂(選択としてポリウレタン)と架橋剤(アザシクロプロパン)が反応した架橋化合物を含むことが示唆されています。
以上より、「接着性ポリウレタン」と「その100重量部に対する0.5〜17重量部のアザシクロプロパン系架橋剤」による架橋化合物を含む接着層の構成が明細書に包含開示されています。

その他にも、以下のような点について、AIの判定内容に疑わしい箇所がないかを確認します。

  • 「アザシクロプロパン系架橋剤」などの技術的な用語や、その特許文献中でのみ登場するような概念を正しく理解できているか
  • 文献中に具体的な数値で「2重量部」などと記載されている場合、「0.5~17重量部」に該当すると認識できているか
  • 単に「ポリウレタン」とだけ記載されている場合(ポリウレタンが接着性であることを否定する記載はないが)「接着性ポリウレタン」にあたらないといった判断をしていないか

これらの点を確認したうえで、必要に応じて「○○とは、~を意味する。」「○○の例としては、~が挙げられる。」といった説明や「○○には、~を含めてください。」といった指示をプロンプトへ追加し、判定結果が変わるか確認・調整します。

(4)AIモデル再検討

しかしながら、意図通りに判定してくれるようにプロンプトを調整することが難しい場合もあります。また、AIの判定が信頼できず、誤判定の有無を結局人手で確認することになれば、生成AIを活用する本来の目的が失われてしまいかねません。

一部のAIモデルでは推論の深さを調整できるので、今回使用した「low」から「high」に変更することで、より高精度で複雑な思考をさせることが可能です。推論の深さを上げることで、ユーザーの意図をより的確に推測し、的外れな回答は減少します。

しかし、その分推論時間とコストは増大します。
例えば、GPT-5(推論の深さ:low) ⇒ GPT-5(推論の深さ:high)に設定すると、1件あたりの処理時間は約1.4分から約3分に増加しました。この速度では、場合によっては人手による調査のほうが早い可能性もあります。

では、GPT-5より高価なAIモデル(O1、Claude-Sonnet-4 など)を使ってみるとどうなるでしょうか?
プロンプトはそのままで、AIモデルをO1の高推論(推論の深さ:high)へ切り替えたところ、約1分10秒で1件の判定が完了しました。GPT-5(推論の深さ:high)の約3分と比べて高速化しています。

ただし、時間的には許容範囲でも、今度はコスト面で課題がでてきます。
上記のO1の例では、1件で約100円弱かかっており、単純計算(×772)で約7~8万円程度と想定されます。

このように、モデルを高推論化・高性能化するほど、速度・コストとのトレードオフが顕著になります。

5.まとめ

生成AIを用いた特許調査では、プロンプトの内容によって判定結果が大きく左右されるため、案件ごとにプロンプトを適切に調整し、意図どおりの応答が得られるかを逐次確認する必要があります。特に化学系特許で頻出する数値範囲の扱いについては、誤判定が生じやすく、注意した方が良さそうです。

調査の質という観点では、推論の深さをhighに設定することで判定の信頼性は向上しますが、その分処理時間が長くなり、場合によっては人手調査と同程度の時間を要することがあります。また、高推論設定や高性能モデルを使用した場合には、コスト負担が増大し、費用対効果の面で課題は残ります。

あくまで今回の試行に基づく限りでは、生成AIは文脈を誤って理解したと考えられるケースで誤判定が生じる傾向がみられました。これはある意味当然の特性ではあるものの、文脈が正しく解釈できたケースでは概ね安定した判定が得られ、今回の誤判定率は全体の2割程度という印象でした。判定根拠として引用された文章にもハルシネーション(虚偽生成)は見られず、引用箇所の整合性も良好でした。

現時点(2025年10月)では、精度を重視する必要がある特許調査において生成AIにスクリーニング業務を全面的に任せるには、まだ難しい側面が残る印象を受けます。しかしながら、生成AIの進化スピードを踏まえると、近い将来には文脈理解力や判断精度がさらに向上し、実用レベルに到達する可能性は十分にあります。
今後の知財実務では、生成AI活用スキルの重要性が一層高まっていくことが予想されます。業務内容ごとに「使える/使えない」の議論がされている昨今ですが、いずれにしても早い段階で生成AIに慣れておくことは、これから先の業務遂行に大きなメリットをもたらすでしょう。

(日本アイアール株式会社 特許調査部 Y・A)