第二回:『CAEとAIの組み合わせ』CAEとAIの違いと特徴

CAEとAIの組み合わせの三回シリーズで解説します。第二回目では、CAEとAIの違いと特徴についてお話します。
1.はじめに
CAE(Computer Aided Engineering)とAI(本記事では機械学習のことを指します)の違いは何でしょうか?両方ともコンピュータを用いますので、なんとなく両技術は似たような仕組みで動いていて、コンピュータ内部の複雑な計算に基づいて、我々の与えた指示に対する解を賢く与えてくれると思いがちです。しかし実は、解を得るための両者のアプローチは真逆です。アプローチが逆ですので、得られた結果が似ていたとしてもその特徴や性質は異なります。実際の応用では、このような違いを理解することでより本質的・実効的・効率的な課題解決を図ることができます。
連載第二回の本コラムでは、CAEとAIの違いを、解を得るためのアプローチの違いから考え、さらに、両者を組み合わせた建付けとその利点を考察します。
2.CAEとAIのアプローチの違い
図1に、計算科学(CAE)とデータ科学(機械学習)のアプローチの違いを、半導体用シリコンの結晶育成の解析を例に表します。半導体用のシリコン結晶では、ウェハの強度や特性に影響する酸素不純物濃度の制御が非常に重要です。結晶は、チョクラルスキー(CZ)法と呼ばれる方法によって育成されます。この方法では、坩堝内に形成したシリコン融液からゆっくりと結晶を引き上げることで単結晶のシリコンを育成しますが、その過程で石英坩堝から溶解した酸素が、融液内での輸送を経て不純物として結晶に取り込まれます。この過程には、融液および周囲の気体の流れが強く影響しますので、熱流体シミュレーションによって結晶成長環境を模擬し、所与の育成条件での結晶成長実験の結果(例えば、結晶長さ方向の酸素不純物濃度の分布)を予測します。
このCAE(熱流体シミュレーション)では、液体および気体の流れを記述するナビエ・ストークス方程式が基礎方程式となり、所与の条件における流れの状態を、有限体積法などの手法を用いて方程式を解くことで求めます。さらに、求められた流れの状態から酸素の輸送を計算し、結晶への取り込み反応モデルを介して、結晶中の酸素不純物濃度を計算します。この一連の流れは、支配する物理法則や育成条件を所与としてスタートしますので、“演繹”のアプローチと言えます。
一方、データ科学のアプローチは、データをスタートとします。著者らの事例[1,2]では、実際のシリコンインゴットの育成・評価データを数百本分収集し、育成条件と酸素不純物濃度を対応付ける機械学習モデルを作成しました。このモデルを用いることによって、所与の育成条件での結果(例えば、結晶長さ方向の酸素不純物濃度の分布)を予測することができます。最終的に予測したいことは、CAEと同じですが、アプローチが異なります。データ科学は、実験結果のデータをスタートとする、“帰納”のアプローチと言えます。
ここで、図からも分かるように、データ科学のアプローチは物理法則を用いていないため、物理的な根拠がないと言われることもあります。しかし、例えば著者らの結果[2]では、機械学習モデルから予測される酸素不純物濃度の傾向は、よく知られた酸素輸送・取り込みメカニズムやシミュレーションの結果ともよく整合していました。すなわち機械学習モデルの内部では、物理的な知見を獲得していると考えることができます。さらに最近では、説明可能AIによる獲得知見の可視化や、既知の物理法則を制約条件に用いた機械学習モデルの学習など、データ起点のシンプルなアプローチから、物理を組み合わせた様々な手法へと広がりを見せています。

3.CAEとAIの組合せ
さてここから、話は一段、複雑になります。図1のデータ科学アプローチでは、実際の結晶の育成・評価データがスタートとなりました。ここで図2のように、スタートのデータを、育成条件を変えて計算した多数のCAE結果に置き換えるとどうなるでしょうか。この教師データを用いることで、図1の場合と同様に、所与の育成条件での結果(例えば、結晶長さ方向の酸素不純物濃度の分布)を予測する機械学習モデルを作成することができます。この予測モデルは、実際の実験結果ではなく、CAE結果を予測します。すなわち、CAEの代替モデルと言うことができます。このような機械学習モデルを作成することにはどのような利点があるでしょうか。
CAEの計算にはある程度の時間がかかります。実際の実験よりも一般的には短時間で結果が得られますが、それでも複雑な現象を考慮した詳細な計算になればなるほど計算時間は増加します。一方、機械学習はデータ作成には時間を要しますが、ひとたび予測モデルができてしまえば、1回の予測は非常に短時間で行うことができます。そのため、大量の予測に基づく網羅的なマップの作成や、繰り返し計算が必要となる条件最適化などで威力を発揮します。またこのデータ作成は、定められた範囲で条件を振ったCAEの実施になりますので、並列化することができます。つまり、クラウドサーバーなどを使い大量に並列化すれば、短時間で終わらせることができます。クラウド環境がより整備されるであろうこれからの時代には、CAEを用いた大量の教師データ作成は時間的な意味では負担ではなくなるかもしれません。

4.さいごに
最後に、図2のようなCAE結果を教師データに用いたアプローチの呼び方について考えてみましょう。図1(a)のCAEのアプローチは物理駆動(Physics-driven)、図1(b)のデータ科学のアプローチはデータ駆動(Data-driven)と呼ばれることがあります。では、図2(c)のアプローチはどちらになるでしょうか。
現在は、強調したい側面に応じて両方の呼ばれ方が用いられています。実際に著者は学会などで両方の呼ばれ方を目にしました。応用分野でよくあることですが、このケースも、同じ概念・手法が見る側面によって別の言葉になってしまう例の一つです。表面的な言葉に惑わされず、本質が何かを考えることが大切です。
連載第二回の本コラムでは、CAEによるアプローチ、機械学習によるアプローチ、CAEと機械学習を組み合わせたアプローチの3種類が登場しました。これらは、どのアプローチが優れているということではなく、直面している課題や条件、目的に応じて使い分けることが肝要です。次回の第三回のコラムでは、最適化の建付けの中で、これらのアプローチの特徴を考えてみたいと思います。
本コラムの内容は拙著「AI開発力を鍛える!機械学習と最適化による問題解決講座」(翔泳社、2025年)の一部をもとに、再執筆したものです。詳しくは同書をご覧ください。
[1] K. Kutsukake, Y. Nagai, T. Horikawa, and H. Banba, Appl. Phys. Express 13 (2020) 125502.
[2] K. Kutsukake, Y. Nagai, T. Horikawa, and H. Banba, Journal of Crystal Growth 584 (2022) 126580.

材料設計を加速させるAIプラットフォーム Citrine Platform
Citrine PlatformはAIを活用して製品開発を加速し、企業のR&D戦略を成功へと導くマテリアルズ・インフォマティクスソリューションです。AIモデルでの予測と実験を繰り返しながら最適解を目指すアプローチにより、少ない実験数で目標特性の達成を目指すことが可能です。

最適化/機械学習による設計空間探索ソフトウエア pSeven Desktop
pSeven Desktopであらゆる設計リードタイムを短縮。煩わしい作業を削減し、CAD・CAE・データとプロセスを自動化します。pSeven Desktop独自のAIと強力な自動化エンジンによって、最適な設計条件を効率的に発見が可能です。
