【化学系特許調査の進め方】化学物質による検索③ InChI, InChI keyでの調査
化学物質の表記は、化学名、一般名、商品名のほか、CAS登録番号等がありますが、名称では調査が難しく、CAS登録番号は使用可能なデータベースが有料なものが多いなど、それぞれ一長一短があります。
化学物質調査の手段の一つとしてInChI、InChI keyがあり、PATENTSCOPEやGoogle Patentsでも採用されるなど、無料でも利用できるようになっています。
今回は、その InChI、InChI key による特許調査について概略をまとめてみました。
なお、このコラムは、主に化学メーカーや医薬品メーカーの知財担当者で、まだ実務経験が少ない方々を対象にした化学分野の特許調査の入門的な内容になっております。
1.InChI、InChI keyとは?
InChI(Intenational Chemical Identifier:インチ)は、1999年にSteve HellerとSteve Steinによって提唱されたもので、分子の構造をある一定のルールに沿って1行で表記(線形表記法)するようにした化学物質の表現方法です。構造ベースの識別子であり、少ない文字数で構造情報を伝えることができる利点があります。2005年にIUPACとNISTの共同開発によって最初のバージョンが発表され、現在ではInChI プロジェクトは、InChI分科会によって管理されています。
InChI keyは、「ハッシュ化InChI」とも呼ばれる25文字固定長の分子表現となっており、短縮されたコンパクト バージョンの InChIです。InChIKeyは、上記InChIに1対1で対応しており、InChIからInChIKeyに変換するソフトもあります。検索エンジン会社との話し合いから生まれたといわれています。
なお、表記のルールは知らなくても調査できますので、ここでは割愛させていただきます。
2. InChI、InChI keyの特徴
InChIには次のような特徴があります。
- 化学物質の構造式のみから生成される。
- 識別子の厳密な一意性がある。
- 非営利かつ自由に利用できる。
- コンパクトでわかりやすい表記方法である。
また、InChI keyには次のような特徴があります。
- 化合物の立体構造を一義的に定義されている。
- 検索に容易なインデックスとしての機能を果たす。
CAS RNが商用ベースでの利用に制限(有料)があるのに対し、InChI、InChI keyは、非営利かつ自由に利用できることは大きなメリットといえます。
3.InChI、InChI keyが使用できるデータベース
InChI、InChI keyが使用できる特許関連のデータベースとしては、下記が挙げられます。
- PATENT SCOPE
- Google Patents
- pubchem 等々
特許データベースとしては、何といってもPATENT SCOPEが検索できることが大きなメリットです。また、Google PatentsでもInChI、InChI keyを用いた検索ができるようになりました。
他にも多くのデータベースで使用されています。
4.InChI、InChI keyの調べ方
PATENT SCOPEや PubChem、J-GLOBALを用いると、InChI、InChI keyを調べることができます。その他、構造式を入力するとInChI、InChI keyを生成することができるWEBサイトもありますし、また、化学構造式描画ソフトであるChemDrawなどでも知ることができるようです。
ここでは、J-GLOBALと PubChemでのInChI、InChI key調査をご紹介します。
(1)J-GLOBAL
トップページで「カンデサルタン」と入力し、表示された結果の中から、「物質 カンデサルタン」を選択すると、下記のようなInChI、InChI keyを含むデータが表示されます。
(2)Pubchem
PubChemでもほぼ同様な操作で、InChI、InChI keyを含むデータが表示することができます。
IUPAC名などとともに、InChI、InChI keyが表示されています。
(3)その他のサイト
その他InChI、InChI keyを調べることができる主なサイトとしては、下記のものが挙げられます。
- Chemical Book
- DRUGBANK online
- ChEMBL
- SureChEMBL
- ChEBI など
5.InChI、InChI keyを用いた検索例
(1)PATENT SCOPE
PATENT SCOPEでの化学物質の検索は、簡易検索よりも化学化合物による検索(無料のアカウント登録が必要です)を行う方が、より効果的な検索を行うことができます。
例えば、カンデサルタンを「化学名」で検索すると・・・
「candesartan」または「カンデサルタン」と入力し、検索を実行すると‥
自動的にInChI keyでの検索となり、結果も表示されます。
なお、最初の画面で「マーカッシュ構造を含む」にチェックを入れると、マーカッシュ(部分)構造検索も同時に行うことができます。
ちなみに、簡易検索で「ALLTXT:(candesartan or カンデサルタン)」で検索すると28977件でした。 (調査日:2022.11.9)
また、InChIがわかっている場合は、検索の種類を「InChI」にして、InChIを入力します。
(※注:下の画像ではInChIの表示が切れています。)
検索すると同様に検索結果が表示されます。
(2)Google patents
Google patentsでもInChI keyを用いた検索ができます。
(3)PubChem
PubChemのフロントページで、SMILES、化合物名、商品名、InChI、InChI key等を入力することによって検索を行うことができます。ただし、InChIの場合は、「InChI=・・」と入力する必要があります。
PubChemでは、特許データを含んでおり、特許の抄録を表示することができます。また、名称部分をクリックし、詳細なデータを表示すると特許の項目があり、特許番号とタイトル等を見ることができます。
また、「WIPO PATENTSCOPE」でInChI keyを用いた調査ができるURLが記載されていることもあります。
6. InChI、InChI keyを用いた検索の注意点
InChI keyは、InChIとは異なり、ごくまれに異なる分子から同じInChI keyが生成されることがあるようですので、InChI keyでの検索はノイズを含む可能性があることに注意を要します。
また、InChI は、ポリマーは範囲外とされており、大きな薬物分子(数百のアミノ酸を持つ抗体など) 、互変異性体や金属化合物には十分に対応できていないところがあるようですので、調査できない化学物質がある可能性があります。
さらに、対応しているデータベースが限られていることもあり、InChI、InChI keyのみでの調査では不十分なことが多いです。調査目的に応じて、InChI、InChI key以外の方法(化学名、商品名、CAS番号など)を併用した検索をすることが必要です。
(日本アイアール株式会社 特許調査部 S・T)