化学系サーチャーが知っておきたいIUPAC命名法の基礎知識
文献や特許を検索する場合、化学物質の名称を用いることは多いですが、化学物質の名称の中でも理解しづらいのがIUPAC名かと思います。IUPAC名は複雑なルールがあり、サーチャーにとって習得するのはなかなか難しいものといえます。
IUPAC名のみで検索することはそれほど多くないとは思いますが、化合物辞書ファイルなどを検索したり確認したりする際に、多少でもIUPAC名を知っておいた方が良いこともあります。
そこで、このコラムでは特許サーチャーの観点から知っておきたいIUPAC命名法(有機化合物命名法)について取り上げてみたいと思います。
なお、IUPAC命名法にもいくつか種類がありますが、本コラムは置換命名法(S命名法)を中心に記載することにします。
1. IUPAC命名法の成り立ち
「カンデサルタン」を題材として、ある一例の IUPAC命名法について見ていきましょう。
IUPAC名: 2-ethoxy-3-[[4-[2-(2H-tetrazol-5-yl)phenyl]phenyl]methyl]benzimidazole-4-carboxylic acid
(※出典:https://pubchem.ncbi.nlm.nih.gov/compound/66880216)
カンデサルタンは化学構造もIUPAC名も複雑です。今回はIUPAC名を以下のように見ていくことにします。
IUPAC名の構造
IUPAC名は、接頭語、母体構造、接尾語の3つがこの順に並んでいます。最重要なのは母体構造で、次いで接尾語、接頭語となります。
- 母体構造(母体化合物、基本骨格[Parent]):化合物命名の基本となる部分です。
カンデサルタンの母体構造はベンズイミダゾールになります。
2-ethoxy-3-[[4-[2-(2H-tetrazol-5-yl)phenyl]phenyl]methyl]benzimidazole-4-carboxylic acid
化学構造としては下記の部分になります。
- 接尾語[Suffix]:母体となる主基(官能基)を表します。
カンデサルタンの接尾語はカルボン酸になります。
2-ethoxy-3-[[4-[2-(2H-tetrazol-5-yl)phenyl]phenyl]methyl]benzimidazole-4-carboxylic acid
化学構造としては下記の部分になります。
- 接頭語[Prefix]:置換基の位置と名称を示しています。
カンデサルタンの接頭語は残りの部分になります。
2-ethoxy-3-[[4-[2-(2H-tetrazol-5-yl)phenyl]phenyl]methyl]benzimidazole-4-carboxylic acid
化学構造としては下記の部分になります。
2. IUPAC名の作成手順
IUPAC名を作成する場合は、まず母体構造を決め、次いで接尾語をつけ、残りを接頭語とします。
母体構造(母体化合物、基本骨格[Parent]) → 接尾語[Suffix] → 接頭語[Prefix]
という順になります。まずは、母体構造から見ていくことにします。
(1)主基を探す
IUPACの名称は、原則として母体構造と主基を組み合わせて母体構造の名称(語幹)とします。
2種類以上の異なる特性基を持つ化合物の場合は、そのうちの一つを主基とし、主基を接尾語で、その他の特性基を接頭語で表します。
《特性基とは?》
炭化水素や芳香族、複素環系の水素を置換した原子や原子団を「置換基」と言いますが、その置換基のうち母体に組み入れられている原子や原子団を特性基と言います。たとえば、ハロゲン、-OH、-NH2、=O、-COOH、アセチルなどが挙げられます。ただし、メチル、フェニル、ピリジルは特性基としないとされています。
主基として用いる特性基がある場合は、その種類を決定します。
カンデサルタンには、カルボン酸、エトオキシ基、テトラゾール等の特性基があることが化学構造式からわかりますが、このうちの一つを主基とします。
主基の選定には下記のようなルールがあります。
① 接頭語としてのみ用いられる特性基
特性基のうち、どのような場合にも接頭語としてのみ用いられる特性基があります。接尾語で表されることはなく、主基にはならない特性基です。「強制接頭語」とも呼ばれています。
《強制接頭語の代表例》
- ハロゲン(F、Cl、Br、I)
- アジド(-N3)
- イソシアノ(-NC)、イソシアト(-NCO)
- ニトロ(-NO2)、ニトロソ(-NO)
- アルコキシ(-OR)
- アルキルスルファニル(-SR)、アルカンスルフィニル(-SOR)、アルカンスルホニル(-SO3R) 等
カンデサルタンにはエトキシ基がありますが、強制接頭語であるエトキシ基は主基にはならないことになります。
② 特性基の優先順位
強制接頭語を除いた特性基が複数ある場合は、下記の優先順位により主基を決めます。
より上位の特性基を主基として命名します。
《特性基の優先順位》
- ラジカル、アニオン、カチオン、イオン化合物
- 酸 -COOH、-C(O)OOH、-CSOH等のS、Se類縁体、スルホン酸、スルフィン酸、ホスホン酸等
- 酸無水物
- エステル
- 酸ハロゲン化物
- アミド
- ヒドラジド
- イミド
- ニトリル
- アルデヒド、ケトン
- アルコール、フェノール、チオール
- ヒドロベルオキシド
- アミン、イミン
- ヒドラジン
- エーテル
以上をカンデサルタンに当てはめてみますと、主基になりうるのはカルボン酸になります。
カルボン酸以外の特性基は接頭語として命名することになります。
(2)母体構造(母体化合物、基本骨格[Parent])を探す
次に母体構造を決めます。化合物命名の基本となる骨格で、IUPAC名の語幹になります。
母体構造の選定には次のようなルールがあります。
- 環を含まない脂肪族化合物は、主鎖(命名と位置番号の基礎となる鎖)を母体構造とする。主基に相当する特性基がある場合は、特性基を最も多く含む鎖を主鎖とする。また、二重結合及び三重結合を最も多く含む鎖を主鎖とする。等のルールがある。
- 脂環状置換基があっても、主基がすべて鎖上にある場合は、脂肪族化合物として命名する。
- 主基を持つ鎖が複数ある場合は、なるべく多くの主基を含む鎖を主鎖とする。
- 主基が一つの環系にある場合は、その環系を母体構造とする。
- 主基が二つ以上の環系にある場合は、なるべく多くの主基を含む環系を母体構造とする。二つ以上の環系が同数の主基を持つ場合は、より上位の環系(※)を選択する。
- 主基が鎖にも環系にもある場合は、なるべく多くの主基を含む部分を母体構造とする。主基が同数の場合最も重要と考えられる部分等を命名の母体とする。 等々
カンデサルタンの場合は、主基であるカルボン酸がついているベンズイミダゾールが母体構造になります。
《環系の上位下位について》
環系同士の上位下位は以下のようになっています。
- 複素環は炭素環より上位
- 複素環の優先順位はヘテロ原子の種類と位置によって決定される。Nを含む成分が優先され、N以外はハロゲン、酸素、硫黄、セレン・・の順に上位とする。
- 環系を構成する数がなるべく多いものを上位とする。
- 縮合環系の場合は、縮合環系の中の最大の環から順に比較して大きさの異なる最初の環が大きいものを上位とする。 等々
(3)接尾語[Suffix]を決める
接尾語は、母体構造についている特性基のうちの一つを主基として接尾語で表し、その他の特性基はすべて接頭語とします。接尾語は化合物の種類によって表記が決められています。
[化合物の種類 :接尾語]
- カルボン酸 :carboxylic acid / oic acid
- チオカルボン酸: cabothioic acid / thioic acid
- カルボン酸塩 :carboxylate / oate
- 酸無水物 :oic anhydride / ic anhydride
- エステル :carboxylate / oate
- アミド :carboxamide / amide
- ニトリル :cabonitrile / nitrile
- アルデヒド :caboaldehyde / al
- チオアルデヒド: carobothialdehyde / thial
- ケトン :one
- チオケトン: thione
- アルコール / フェノール :ol
- チオール :thiol
- アミン :amine
- イミン :imine
カンデサルタンの場合は、主基であるカルボン酸carboxylic acidを接尾語として用います。
以上から、カンデサルタンは、ベンズイミダゾールを母体構造、カルボン酸carboxylic acidを接尾語として命名します。
2-ethoxy-3-[[4-[2-(2H-tetrazol-5-yl)phenyl]phenyl]methyl]benzimidazole-4-carboxylic acid
化学構造ではこの部分になります。
ちなみに、carboxylic acidの前にある4-は、benzimidazoleの4位に結合しているという意味です。
・・・ここまでいかがでしょうか?特性基、主基、母体等々耳慣れない方もいらっしゃるかと思います。
サーチャーとしては、母体構造 + 接尾語が見つけられれば十分かと思います。
細かなルールはさらにあるのですが、とりあえず、官能基を見つけ、強制接頭語を除き、接尾語の化合物の種類でより上位のものを主基として、その主基のつく部分を母体とする・・程度の理解でよいと思います。
他の医薬品を見てみます。
3.他の医薬品IUPAC名の例
カンデサルタン以外の医薬品の例をいくつか挙げてみます。
- 一般名:アトルバスタチンカルシウム水和物(Atorvastatin Calcium Hydrate)
IUPAC名:Monocalcium bis{(3R,5R)-7-[2-(4-fluorophenyl)-5-(1-methylethyl)-3-phenyl-4-(phenylcarbamoyl)-1H-pyrrol-1-yl]-3,5-dihydroxyheptanoate}trihydrate
1) 主基:特性基としては、アミド、ヒドロキシ、カルボン酸塩があり、この中で優先順位が高いのはカルボン酸塩になります。
2) 母体構造:カルボン酸を構成しているヘプタン(heptane)を主鎖として母体構造とします。
3) 接尾語:カルボン酸塩の接尾語は-oateとなります。
よって語幹は、heptanoateとなります。
- 一般的名称:ニフェジピン(Nifedipine)
IUPAC名:Dimethyl 2,6-dimethyl-4-(2-nitrophenyl)-1,4-dihydropyridine-3,5-dicarboxylate
1) 主基:特性基としては、ニトロ、カルボン酸があります。より上位のカルボン酸が主基になります。
2) 母体構造:カルボン酸がついている、(ジヒドロ)ピリジン(dihydropyridine)が母体構造となります。
3) 接尾語:主基のカルボン酸が2つあるジメチルエステルですので、語尾がdicarboxylateとなります。
- 一般的名称:アセトアミノフェン(Acetaminophen)
IUPAC名:N-(4-Hydroxyphenylacetamide)
1) 主基:特性基としては、ヒドロキシとアミドがあります。アミドの方が上位ですので、アミドが主基になります。
2) 母体構造:アミドを構成する部分を母体とします。アセチルの部分となります。
3) 接尾語:主基のアミドの接尾語は-amideとなります。
よって、アセトアミド(acetamide)となります。
- 一般的名称:ギメラシル(Gimeracil)
IUPAC名:5-Chloro-4-hydroxy-1H-pyridin-2-one
1) 主基:特性基としては、ヒドロキシとケトンがあります。ケトンの方が上位ですので、ケトンが主基になります。
2) 母体構造:主基が一つの環系にある場合は、その環系を母体構造としますので、ピリジン(pyridin)を母体構造とします。
3) 接尾語:主基のケトンの接尾語は-oneとなります。
4.サーチャーとして知っておきたいこと
サーチャーがIUPAC名を作成することは殆どないと思われますし、また、医薬品や流通している化学物質は一般名や慣用名などがあり、化学構造からも検索できるため、調査にはあまり不自由しないことが多いと思います。
しかし、化合物辞書ファイルを用いた類似物質の調査などでは、得られた化合物のデータがIUPAC名しか表示されないケースがあり、調査の目的物に近いか否か、調査対象に含めるべきかの判断を迫られることもあるため、IUPAC名の基礎は知っておいて損はないと思います。
サーチャーは、IUPAC名を十分に理解する必要はないと思いますが、できれば押さえておきたいのは[母体化合物 + 接尾語]の部分です。この部分は化合物辞書ファイルでキーワードとして検索に用いることもできることから、サーチャーにとっても重要であると思われます。
カンデサルタンはベンズイミダゾール、アトルバスタチンはヘプタン酸エステル・・です。これとその他の特徴ある部分を組み合わせることにより、検索での絞り込みに利用できる場合があります。
母体化合物 + 接尾語だけでも理解するのは大変かもしれませんが、まずここから始めてみるのもよいかと思います。
終わりに
他のIUPAC命名法の解説は、炭化水素から始めていますが、覚えなければならないことが多すぎるように思いますので、本コラムは具体的な医薬品を取り上げる内容にしてみました。これをきっかけにIUPAC命名法に馴染んでいただけると幸いです。
なお、化合物としては置換基のつく位置も重要なのですが、それらについては別コラムでご紹介予定です。
(日本アイアール株式会社 特許調査部 S・T)
《参考文献》
1)化合物命名法IUPAC勧告に準拠第2版 日本化学会命名法専門委員会編 東京化学同人