材料開発にかかる時間とコスト、人的リソースを大幅に削減 MI分野の注目ソリューション「Citrine Platform」
- 材料開発
- MI
- AI
- ../../../article/2023/02/citrineplatform.html

IoTに欠かせない半導体やEV(電気自動車)搭載用電池などの需要は、近年ますます高まっています。それらの性能向上を追求すると同時に、近年激しさを増す競合間競争と環境規制に対応するため、製造業では新材料の開発および開発の高速化が求められています。そこで注目されているのが、AIの活用によって材料開発を効率化するマテリアルズ・インフォマティクス(MI)。しかし、その導入には課題もあります。この記事ではMIの導入を検討している企業様に向けて、4つの課題を明らかにし、その解決方法と具体的な導入方法についてお伝えします。
【この記事を書いた人】ITPNAVI編集部 加藤優子
ITPNAVI編集部の加藤です!連載「カトウタイムズ」でさまざまなIT関連の最新情報を、SCSK社員である私の視点で皆様にお届けしています。今回は材料開発分野で注目される新技術、「マテリアルズ・インフォマティクス(MI)」に関するセミナーに参加してきましたので、ここで内容をまとめてご紹介します。
MIソリューションとして世界中で利用されているのが「Citrine Platform(以下Citrine)」です。本記事は、材料開発における課題とそれを解決するMIおよびCitrineをテーマに、SCSKが開催したセミナーをもとに執筆したものです。
目次
マテリアルズ・インフォマティクス(Materials Informatics:MI)とは、機械学習やデータマイニングなど、いわゆるAIの技術を用いて材料開発を高速化・効率化する技術です。
従来の材料開発は、開発者の経験と勘に基づき試作と実験を繰り返す属人性の高いものでしたが、MIによってデータを論理的に分析し予測に用いることで、効率良く目的の材料を探し出すことが期待できます。
AIは既に画像認識や自動運転といった様々な場面で活用されています。一方、材料開発においてはその性質から、AI活用を阻む特有の課題がありました。MI実用化に向けた4つの課題について、既にAI活用が進んでいる分野と比較しながら紹介します。
【表1】材料開発分野におけるAI特有の課題
材料開発分野でMI導入に際し問題となるのが、そもそものデータの「量」の少なさです。
AIで精度の高い予測モデルを作成するには、元となる学習データを大量に準備する必要があります。例えばAIがよく活用される画像認識では、数千、数万といった膨大な画像データが用いられています。
一方、材料開発分野では、企業が個別に取り組んでいることや担当者によってデータを保存していない、あるいは保存していてもデータ形式がバラバラで再利用できないことが多く、数十ほどの少量のデータしか集まらないという問題があります。
データの量に加えて「質」も重要です。例えば自動運転の場合、AIに晴れた日の明るい画像データばかりを学習させてしまうと、学習データには無かった雨の日や夜の暗い道の認識精度が落ちてしまうため、日中や夜間、天候の変化による運転環境の条件を増やし満遍なく学習データを集める必要があります。
一方、材料開発においてデータソースとしてよく用いられるものは論文などに限られています。論文に掲載されるのはほとんどが成功例のため、失敗データが集まりにくい傾向があります。こうしたデータの偏りがAI活用を阻んでいます。
さらに材料開発分野では、「従来比で強度が2倍の特性を持つ材料を見つけたい」といった、過去の前例(データ)がないことを予測したいケースがほとんどであることも、データの質・量の不足に影響しています。
MIの実用化には、材料開発における「材料」への高度な専門知識が必要になります。
予測モデルの精度を判断する際、通常のAIでは、すべての予測結果のうち「いくつ正しく予測できたか」を統計学的な観点で明確に評価できます。例えば写真の動物を猫かどうか見分ける画像認識モデルにおいて、猫を猫と予測できた数、あるいは猫以外の動物を猫ではないと予測できた数です。
一方で材料開発においては、予測モデルによって導き出された候補材料AとBのうち、「どちらがより目指す性質に近いか」を判断するには、単にその予測結果のみを比べるだけでは不十分です。既述の通り、材料開発の学習データには限りがあるため、予測結果の不確実性が大きいのです。
また材料を構成する物質には個体差があり、それが材料の性質にも影響して結果にバラつきが生じます。材料に対する知見をもとに、この不確実性やバラつきをどの程度、そしてどう考慮するかを踏まえ、予測結果を評価しなければいけません。
同様に、材料を表す化学式や構成原子の原子番号はそれだけでは単なる文字列にしか過ぎず、それらをどう数値化(意味づけ)してAIに反映するかにも、同じく材料に関する専門知識が求められます。
MIの導入には、データ分析における「逆問題」に対応できるAIソフトウェアが必須です。一般的なAIソフトウェアは順問題にしか対応していないものが多いことが、材料開発分野へのAI活用を難しくしています。
ここで、材料開発分野での「順問題」と「逆問題」について簡単に解説します。
順問題とは、AIモデルの構築に使われた学習データと同様のデータを用いて特定の結果を予測することです。材料開発で言うと、
1.物質の組成や構造情報を学習データとして、材料としての強度や特性を予測するAIモデルを作成する
2.物質の配合を変えたらどんな材料特性になるのか?を予測する
という流れです。
一方で逆問題とは、名前の通り上記の逆手順を言い、求めたい結果(材料の特性)が得られるような条件(物質の組成や構造情報)を予測することです。材料開発で必要なのは、「特定の物質をある割合で用いたらどんな特性の材料が出来るか?」を予測することではなく、「欲しい特性を持つ材料を作るために必要な物質は?」を予測すること、つまり逆問題です。
逆問題に対応できることがMIの課題を解決し、導入を成功させる必須条件ということになります。
以上がMI導入を阻む4つの課題となります。次からはこれらの課題を解決する方法について解説します。なお、上記すべてに対応するソリューションが「Citrine Platform」です。すぐに製品について知りたい場合は以下をご覧ください。
前述した問題を解決し、AIを材料開発に活用するための手法として、逐次学習(Sequential Learning)があります。ここではMIの上記それぞれの課題を、逐次学習の適用と対応させながら紹介します。
逐次学習とは、AIモデルでの予測と実際の実験を繰り返して、相互改善しながら最適解を目指すアプローチ(従来よりも少ない実験数で最適解を目指す手法)です。材料開発分野で効果的に適用する、具体的なフローは以下のとおりです。
【図2】逐次学習(Sequential Learning)による材料開発への効果的なAI活用
このフローを繰り返すことによって、従来の研究開発手法に比べてより少ない実験回数で、効率的に目的とする材料を発見することが可能です。なお、この逐次学習(Sequential Learning)をベースに開発されたMIツールが「Citrine Platform」です(詳細は後述)。
【参考】逐次学習(Sequential Learning)とは
過去のデータを用いて係数を一括で学習し、運用においては係数を固定して利用する手法を一括学習と呼び、新しく観測データを入手するごとに係数を更新する学習方法を逐次学習と呼ぶ。
(引用)気象庁リーフレット
「課題①:データの少なさ」と「課題②:データの偏り」「課題③:材料開発に関する高度な専門知識」でも触れた「材料開発特有の要素」も、逐次学習と組み合わせることで効果的・効率的な材料開発が可能になります。材料開発に逐次学習を効果的に適用しMIを実現するポイントについて、Citrineの特徴を例として引きながらご紹介します。
Citrineは逆問題に対応しMIを実現できることは前述のとおりです。この機能を使い、設定した条件・制約を満たす材料の候補軍を選定します。具体的には、以下の流れになります。
【図3】Citrineは材料開発に必要な逆問題にも対応
設計空間として最初にあたりをつける候補材料群に、そもそも有望な候補が入っていなかったり、予測結果をスコアリングする基準が不明確・不適切だったりすると、求めたい材料にたどり着くことはできません。つまり、目的の材料を効率良く正確に予測するには、設計空間とスコアリングの精度を高めることが非常に重要です。
Citrineは材料開発に特化した専門的なデータ、例えば各材料の構成物質、組成、製造プロセスなど設計空間に考慮します。「この物質を何%以上使用する」「このプロセスで製造する」といった制約条件を設計空間に設定することによって、開発者の知見を反映し、より可能性の高い候補材料群を導きます。
また予測結果を評価する際は、既述の通り不確実性やバラつきを考慮しなければいけません。Citrineはそれらを定量化してスコアリングするため、本当にその候補材料が目的の特性を満たすかどうかを精度良く予測することが出来ます。
【図4】材料開発に特化した設計空間とスコアリング
それでは最後に、マテリアルズ・インフォマティクス(MI)分野の注目ソリューション「Citrine Platform」を使った材料開発の手順について簡単にご紹介します。
CitrineはSaaSのため、Microsoft EdgeやGoogle ChromeなどのWebブラウザから直感的に操作できます。データ、AIモデル、サーチスペース、候補材料選定の4つのブロックからなり、それぞれを順番に設定していくことで、逐次学習=Sequential Learning をベースにしたMIが実施できます。
【図5】Citrineのインターフェースと機能
学習用の入力データを格納するブロックです。AIモデルに読み込む学習用の入力データとして、原材料の化学式や物性、製造プロセスなどの様々な材料情報を格納し、その中身を確認できます。
AIモデルを構築・学習するブロックです。手順1で取り込んだデータからどの要素をAIモデルに組み込むのか、求めたい予測結果(例:材料の強度など)などを指定することで、ノーコードでAIモデルを作成できます。
候補材料群を求めるための設計空間を定義するブロックです。特定の素材を含む/含まないといった選択、この素材をX%~Y%使用する、製造プロセスにおいてXX℃~YY℃の温度範囲で焼成するといった範囲を条件として設定できます。
導き出された候補物質の詳細を確認するブロックです。手順1で構築した予測モデルに対し、SEARCH SPACEの設定内容を反映して導き出された候補物質を確認できます。予測結果の不確実性を踏まえたスコアリング機能により、有望な候補材料が順位付けされた状態で確認できます。
最終的にCANDIDATESで提示された有望な候補材料を実際に試作し、その結果をさらにDATAに読み込んで上記のSequential Learning のフローを回します。直感的な操作と開発者の知見を盛り込んだSequential Learning によって目的の材料へ迅速に到達でき、材料開発の高速化を実現します。
★材料開発の高速化を実現する革新的なMIソリューション「Citrine Platform」
本記事ではマテリアルズ・インフォマティクス(MI)導入に伴う4つの課題について、MI分野の注目ソリューション「Citrine Platform」を用いた解決方法を、SCSK主催セミナーによる内容からピックアップして紹介しました。
Citrine Platformは2022年7月に取り扱いを開始したばかりのソリューションですが、新材料のニーズが高まる中、既に大きな注目を集めています。今回のアフターレポートで紹介したものを含め、SCSKがこれまで開催したMIに関するWebセミナー(全7回)を専用サイトにて配信しています。ご興味のある方はぜひご視聴ください。
ご視聴はこちら:【SCSK会員制動画配信サイト】お申し込み | SCSK株式会社
製品についての
詳しい情報はこちら
資料ダウンロードはこちら
資料ダウンロードアフターレポートでは紹介しきれなかったCitrineセミナー(2回分)の講演資料を配布中!
◆この資料でわかること
①まずは基本から!材料開発におけるAI活用の課題とその解決策としてのMIについて
②MIを実現するポイントについて、学習モデルの観点からより詳しく解説
ご質問やご相談は
お気軽にご連絡ください
最新情報などをメールでお届けします。
メールマガジン登録