【化学系特許調査の進め方】化学物質による検索⑤ 化学構造での調査(構造検索)
化学物質を調査する場合、対象の化学物質が特定できる場合は、IUPAC名、CAS RNや一般名、商品名等の名称などから調査をすることができます。しかし、多数の物質を一度に調査したり、不特定の化合物を調査したりする場合は、名称等から調べると時間も手間もかかりますし、場合によっては調査ができないこともあります。
また、化学物質の新規性調査の場合、調査対象の化学物質は新規であることが前提であるため、IUPAC名は考えられるものの、CAS RNや一般名、商品名等の名称が無い段階での検索は難しいです。このような調査をする場合、化学構造式による検索が有効となります。
今回は、その中でも化学構造による特許調査について概略をまとめてみました。
なお、このコラムは、化学メーカーや医薬品メーカーの知財担当者でまだ日の浅い方々を対象にした化学分野の特許調査の入門的な内容になっております。
1. 化学構造検索とは?
化学物質の名称や索引によらない化学構造式を念頭に置いた調査として、例えば、下記のような化学構造検索があります。
- 完全一致検索: 単一の化合物を調査する検索です。
- 部分構造検索: 化学構造の一部分が合致する化合物を検索対象とします。
- 類似構造検索: 分子全体が類似している化合物を検索対象としており、創薬研究などで用いられています。
その他にも、フラグメント一致検索やスーパーストラクチャー検索といわれるものがあります。
これらは、化合物の構造に基づいて索引付けがされており、これを用いて検索する手法をとります。1980年代初めからCAS(Chemical Abstracts Service)などでグラフィック端末を用いた化学構造検索サービスが提供されています。
2. 特許調査における化学構造検索の種類
特許調査においては、次のような検索が用いられます。
(1)完全一致検索
調査対象の単一の化合物の名称、InChI、SMILESを用いたり、化学構造式を用いた検索です。
(2)マーカッシュ検索(マルクーシュ検索)
官能基の選択肢や類似構造をまとめて記述した化学物質の表記であるマーカッシュ形式で検索を行う方法です。上記の部分構造検索と類似構造検索を含めた検索といえます。マーカッシュ検索には、InChI Keyを用いた検索や化学構造式を用いた検索があります。
3.化学構造が使用できるデータベース
特許に関連する化学構造検索が使用できる無料のデータベースとしては、例えば、下記のようなものが挙げられます。
(3)、(4)は、主な商用データベースとして挙げられます。
(1)PATENT SCOPE
「PATENT SCOPE」はWIPOが提供している無料の特許データベースで、SMILESやInChIといった線形表記法からのマーカッシュ検索や化学構造式を描画してからの調査が可能です。なお、PATENT SCOPEの化学構造検索は、専任者のマニュアル作業を伴わずに機械的にデータが構築されており、公報のテキスト中から化合物の検索キーが作成されるようです。
(2)PubChem
フロント画面から「Draw Structure」を選択することにより、化学構造式を描画することができ、目的の化合物やその類似構造等を調べることができます。個々の化合物を選択すると、特許情報を得ることができる場合があります。
(3)DWPIM
DWPI ファイル由来のマーカッシュ構造を収録するデータベースです。WPIに収録された特許のうち、医薬分野、農薬分野などの化学分野に分類された特許が、DWPIMの収録対象となっています。化学物質としては、有機化合物、有機金属化合物をはじめ種々の化学物質がマーカッシュ構造単位で収録されています。
(4)MARPAT
CAS(Chemical Abstracts Service)が作成するデータベースで、1988年以降のCAplusファイルに収録された特許などのマーカッシュ構造を収録しており、マーカッシュクレームで書かれた有機低分子化合物を構造検索できるように索引付けがされています。
また、その他特許以外のデータベースとして、REGISTRY、SciFinderをはじめとして多くのデータベースがあり、新規性調査や創薬研究に利用されています。
4.化学構造による調査の特徴
化学構造による調査は、下記のような特徴を挙げることができます。
- 検索漏れの原因となる名称によらない検索ができる。
- 名称で表現できない(部分)化学構造でも検索できる。
- 目的の(部分)化学構造に限定した調査とすることができる。
- 一般名や商品名等がまだ付けられていない比較的新しい化合物を調査することができる。等々
ただし、ポリマー等調査対象になっていない化学物質があったり、システムによっては調査の方法や収録範囲に制限があったりします。
また、化学構造検索ができるシステムの多くが商用で、無料で調査できるのは少ないのが現状です。
5.化学構造を用いた調査
ここでは、無料で検索できるPATENT SCOPEを用いて化学構造の調査をご紹介します。
(1)名称からのマーカッシュ検索
PATENT SCOPE では、マーカッシュ検索が可能となっています。特許出願の中に、テキストとして任意の名前(商業名、IUPAC名、INN等)が記載されている場合や構造式で記載されている場合、又は、特許出願に含まれるマーカッシュ定義に含まれる場合のいずれかであれば、特許文献で示されている化合物を検索することができるとされています。
例として、医薬品「カンデサルタン」をマーカッシュ検索をしてみます。
「candesartan」と入力、「マーカッシュ構造を含む」にチェックを入れてリターンキーを押すと‥
自動的にInChI keyでの検索となりますが、「ENUM:(HTQMVQVXFRQIKW-UHFFFAOYSA-N)」がマーカッシュ検索として追加されています。「candesartan」の場合、マーカッシュ検索による件数の増加は、122件でした。
なお、InChI keyがわかっている場合は、簡易検索でも ENUM:(HTQMVQVXFRQIKW-UHFFFAOYSA-N)) 等を用いて検索することができます。
(2)化学構造式を用いた検索(PATENT SCOPEの例)
PATENT SCOPEでは化学構造式を用いた検索をするためにいくつかのツールがありますが、その一部をご紹介します。
① 構造式エディターを用いた検索
PATENT SCOPEに用意されている構造式エディターを用いて、直接化学構造式を描画します。
IUPAC名などとともにSMILESが表示されています。ここではisomeric SMILESが表示されていますが、名称部分をクリックし、詳細なデータを表示すると、下記のようにCanonical SMILESが得られます。
ここでは、カンデサルタンの基本骨格を書いてみました。このページの最下部に検索の種類が表記されていますが、ここでは「部分構造検索」をクリックしてみます。
すると、検出された化合物の一覧が表記されます。
この一覧から、調査したい化合物を選択して(InChI keyの部分が水色に反転)、
「検索」をクリックくすると、検索結果が表示されます。
なお、「すべて選択」して検索したところでは、21788件の特許文献がヒットしました。(原稿執筆時点)
② 構造式のアップロードによる検索
構造式ファイル (MOL 形式)または画像ファイル (PNG, GIF, TIFF, JPEG 形式)をアップロードして化学構造式を入力する方法があります。
たとえば、J-GLOBALで化合物を検索し、そこからMOL fileをダウンロードすることができ、
ダウンロードしたファイルをPATENT SCOPEでアップロードします。
この後、ダウンロードしたファイルを指定すると、構造式エディターに化学構造式が表示されます。
後は、化学構造を修正したりして、1. 同様に検索に用いることができます。
なお、詳しくは、PATENT SCOPEのユーザーガイドをご覧ください。
PATENT SCOPEは、無料のデータベースではありますが、上記のようなかなり有用な検索ができるようになっています。商用データベースを検索する前の、予備的調査として活用することもおススメです。
その他、商用データベースでも同様な化学構造式を用いた検索ができるところがありますが、その検索方法、手順等はデータベース(システム)によって異なりますので、それぞれのマニュアル等をご参照ください。
6.化学構造を用いた検索の注意点
化学構造を用いた検索においては、次のようなことに注意する必要があると思われます。
- 化学構造データの収録国、蓄積期間はデータベースによって異なるため、あらかじめ確認しておくことが必要です。
- PATENT SCOPEなどシステムによっては、化学構造データが機械的に自動抽出されている場合があり、化合物名称などによるキーワード検索とのずれ(例えば、キーワードでヒットするが化学構造検索ではヒットしないなど)が生じることがある。
他の調査同様に、なるべく多くのシステムで調査した結果を総合して判断するのが望ましいと思われます。
(日本アイアール株式会社 特許調査部 S・T)