【化学系特許調査の進め方】化学物質による検索④ SMILESによる調査
化学物質の識別子として、当連載の前回の記事でInChI、InChI keyを取り上げましたが、InChIよりも前にSMILES表記というものが開発されていました。InChI同様に表記が簡潔で、検索に用いることができるなど利点があり、多くのデータベースで用いられています。
今回は、SMILESによる特許調査について概略をまとめてみました。
なお、このコラムは、化学メーカーや医薬品メーカーの知財担当者でまだ日の浅い方々を対象にした化学分野の特許調査の入門的な内容になっております。
1. SMILESとは?
SMILES記法(simplified molecular input line entry system)とは、分子の化学構造を英数字で文字列化した、InChI、InChI key同様、線形表記法に分類される表記法で、1980年代にDavid Weiningerにより開発され、その後に多くの人により改良がなされてきました。
ASCII符号を用いていますので、検索に便利なことから広く用いられるようになりました。
なお、表記のルールは知らなくても調査できますので、ここでは割愛させていただきます。
2. SMILESの特徴
SMILESには次のような特徴があります。
- 化合物を一行で表せる。
- 同じ一次元表記のInChI Keyと違って化学構造が想像しやすい。
- 検索に容易なインデックスとしての機能を果たすことができる。
ただし、複数の表記方法で書けてしまうなどSMILESには表記ゆれの問題が指摘されています。
3.SMILESの種類
SMILESには、下記のようなものがあります。
- generic SMILES::原子と結合のみを記述
- isomeric SMILES:同位体や不斉中心についての記述を含む
- canonical SMILES:generic SMILESをある定義に従って一義的に作成したもの
過去に多くの変更・拡張(SMART記法等)がされているため、統一されていないという問題があります。「複数の表記方法で書けてしまう」という弱点を直すためのコンバーターがあり、それを使って作られるのがcanonical SMILESです。canonical SMILESに統一してデータベースに採用するということになってくれば、SMILESの弱点は少なくなってくるのかもしれません。
ただし、canonical SMILESは、生成アルゴリズムが商用のため自由に使えないという問題があります。これに対して開発されたのが、InChI、InChI keyです。
4.SMILESが使用できるデータベース
SMILESが使用できる特許関連のデータベースとしては、下記が挙げられます。
- PATENT SCOPE
- Google Patents
- PubChem 等々
特許のデータベースとしては、PATENT SCOPEやGoogle PatentsでもSMILESを用いた検索ができるようになりました。
他にも多くの化学データベースで使用されています。
5.SMILESの調べ方
PATENT SCOPEや PubChem、J-GLOBALを用いるとSMILESを調べることができます。その他、WEBサイトでも構造式を入力するとSMILESを生成することができるサイトもあるようですし、また、化学構造式描画ソフトであるChemDrawなどでも知ることができるようです。
ここでは、J-GLOBALと PubChemでのSMILES調査をご紹介します。
(1)J-GLOBAL
トップページで「カンデサルタン」と入力し、表示された結果の中から、「物質 カンデサルタン」を選択すると、下記のようなSMILESを含むデータが表示されます。
なお、SMILESの種類についての表記されていません。下記で説明いたしますが、検索にはちょっと注意が必要です。
(2)PubChem
PubChemでもほぼ同様にSMILESを含むデータが表示することができます。
IUPAC名などとともにSMILESが表示されています。ここではisomeric SMILESが表示されていますが、名称部分をクリックし、詳細なデータを表示すると、下記のようにCanonical SMILESが得られます。
(3)その他のサイト
その他SMILESを調べることができる主なサイトとしては、下記のものが挙げられます。
SureChEMBL、ChEBI、DRUGBANK online等々
6. SMILESを用いた検索例
(1)PATENT SCOPE
PATENT SCOPE での化学物質の検索は、簡易検索よりも化学化合物による検索(無料のアカウント登録が必要です)を行う方が、より効果的な検索ができます。
検索の種類を「SMILES」にてSMILES表記を入力し、リターンキーを押すと‥
検索が自動的にInChI keyとなり、結果が表示されます。
なお、上記J-GLOBAL、PubChemで得られたSMILES(3種類)はいずれを用いても上記のように検索が自動的にInChI keyとなり、同じ結果が得られました。
(2)Google patents
Google patentsでもSMILESを用いた検索ができます。
なお、Google Patentsで、PubChemで得られたisomeric SMILESおよびCanonical SMILESを入力するといずれも同じ件数のヒットが得られましたが、J-GLOBALで表示されたSMILESを用いた検索ではヒットしませんでした。SMILESの種類によっては採用されていないものがあり、検索には注意が必要と思われます。
(3)PubChem
PubChemのフロントページで、SMILES、化合物名、商品名、InChI、InChI key等を入力することによって検索を行うことができます。
PubChemでは、特許データを含んでおり、特許の抄録を表示することができます。また、名称部分をクリックし、詳細なデータを表示すると特許の項目があり、特許番号とタイトル等を見ることができます。
なお、InChI keyの項目には、「WIPO PATENTSCOPE」で調査ができるURLが記載されていることもあります。
7. SMILESを用いた検索の注意点
上記例でもお示ししました通り、SMILES表記には種類があり、データベースによっては採用されていない種類がありますので、検索には注意が必要です。いくつかの種類のSMILESを用いたり、他の方法(化学名、商品名やInChI、InChI key)を併用した検索をして、できるだけ漏れの少ない検索にしていくことが重要です。
(日本アイアール株式会社 特許調査部 S・T)