エグゼクティブサマリー
「材料創製技術を革新するプロセス科学基盤 〜プロセス・インフォマティクス〜」とは、目的材料の合成プロセスを効率的かつ統合的に探索する技術基盤を確立するための研究開発戦略である。ここでは、プロセス・インフォマティクスを「従来からの実験科学、理論科学、計算科学と、近年の進展が著しいデータ科学を、統合的・融合的に活用することにより、目的材料の合成プロセスを効率的かつ統合的に探索する方法」と定義する。
プロセス・インフォマティクスを、所望の機能を有する物質・材料を効率的に探索するマテリアルズ・インフォマティクス、プロセスの内部状態や生成物をリアルタイムに観測する計測インフォマティクスと組み合わせることで、物質・材料創製技術を次ステージに進化させることができる。また、データ科学活用による熟練者の経験知(勘・コツ)の取り込みや、物理化学的解析およびデータ科学的解析との組み合わせによって、各論的・局所的な議論に落ち込みがちであった合成プロセスに対する考え方を刷新し、汎用性の高いプロセス科学基盤へと拡充することをめざす。
現在、ありとあらゆる場面で“材料”への期待が高まっている。 SDGsの達成、カーボンニュートラル社会の構築、資源・物質循環の実現、わが国が目指すSociety 5.0社会の実現や、新型コロナウイルス感染症の猛威によって加速されるデジタル化の流れ、いずれにおいても、新たな材料の創出が決定的に重要となっている。
マテリアルズ・インフォマティクスが新材料開発において強力なツールとなることがさまざまな例で実証されてきているが、そこでは候補となる新材料の組成・構造が予測されているものの、その材料が「実際に作れるのか」、「どう作るのか」まで示された例は少ない。
材料合成プロセスは、材料ごとに手法のバリエーションが多く、それを制御するパラメータも複雑であるため、統一的に扱うことは難しい。このため、個別プロセスの改良・最適化が主となり、最適なプロセスを科学的に探索するアプローチはとられてこなかった。しかし、近年のさまざまな要素技術の進化(データ科学の進展、シミュレーション技術の高度化、プロセスをリアルタイムに観測するオペランド計測技術の開発、ハイスループット実験技術の確立など)や進展著しいデータ科学の活用も期待され、また2021年3月から本格運用が始まったスーパーコンピュータ「富岳」が利用可能になったこともあり、材料合成プロセスを効率的かつ統合的に探索するプロセス・インフォマティクスに取り組むための環境が整いつつある。
本提言において取り組むべき研究開発課題としては、 1 各材料領域におけるプロセス・インフォマティクス手法の構築、 2 プロセス・インフォマティクス共通基盤構築、 3 プロセス科学基盤の拡充を可能にする新たな指針やコンセプトの創出があげられる。
(1) 各材料領域におけるプロセス・インフォマティクス手法の構築
ここでは、有機材料、無機材料、複合構造材料などそれぞれの領域から中核になるプロセスを選び、そこから材料領域ごとにプロセス・インフォマティクス手法を展開していく。
有機材料系合成プロセスでは、マイクロフロー化学での有機合成プロセスが候補例としてあげられる。計算科学やデータ科学を活用した合成経路探索手法と、マイクロフロー化学のような理想系に近い反応空間での合成実験を組み合わせることで、目的化合物の合成経路を効率的に確立するための研究開発を行う。
無機材料系合成プロセスでは、結晶成長プロセスが候補例としてあげられる。精緻なシミュレーションが可能であるが、計算に長時間を要するため現状ではプロセスの設計には使いにくい。実測可能なデータを使った機械学習モデルを構築することより、プロセス状態の高速な予測を可能にし、プロセス設計に活かすための研究開発を行う。
複合構造材料の合成プロセスは、材料自体とその合成プロセスの両面で複雑な材料であり、必要なパラメータ数が非常に多い。機械学習の分野でオートエンコーダーとして知られる次元削減操作において、中間データとして物理的に意味のある値を用いるなどの新たな手法によって複雑なプロセス全体の最適化をするための研究開発を行う。
(2) プロセス・インフォマティクス共通基盤構築
個々のプロセスの要求にこたえるだけでなく、プロセス・インフォマティクス全体を加速する基盤的研究が必要である。そのためには、プロセスのパラメータ空間が広大であることや、多段階プロセスにおいて前後のプロセスへの影響があるような材料合成プロセスの特徴に対処できる、プロセス・インフォマティクスに適した機械学習アルゴリズムの開発が必要になる。
また、材料合成プロセスのシミュレーション・モデリングにはa)実験データに基づく経験パラメータを用いたモデリングや、b)第一原理計算および分子動力学によるシミュレーションがあるが、それらをつなぐ手法であるマルチフィジックス・シミュレーションも重要である。これらの手法を用いて第一原理計算と統計熱力学を融合することにより、各パラメータの寄与を解析可能なモデルを構築する研究も重要である。さらに、実験データの収集方法、ハイスループット実験手法 、ロボットの単位操作の共通化・標準化も重要な課題である。
(3) プロセス科学基盤拡充
データ科学によってプロセス特性を適切に表す記述子を設計することにより、各論的な取り扱いであったプロセスを新たなカテゴリーに分類して議論することができるようになると考えられる。これにより、個々のプロセス解析では理解できなかった、プロセスを制御する重要な共通因子の把握が可能になり、従来は活用が難しかった複数のプロセス間でそれぞれの知見・データなどを活用できるようになる可能性がある。このようなアプローチにより、各論的・局所的であった合成プロセスの議論を刷新し、プロセス科学の基盤拡充につなげる。
上記で述べた研究開発課題を推進していくために、対象プロセスごとにプロセスセンターを設置し、そこに合成プロセス装置、評価・計測装置などを整備することが望ましい。プロセス・インフォマティクス共通基盤は、理論科学、計算科学、データ科学、プロセス技術、計測技術など多岐に渡る専門家の参画が必要であるが、別々の場所で活動するバーチャル拠点であっても機能させることができる。
ただし、プロジェクトごとの一時的な連携でなく、強力な連携を継続する拠点として設置する必要がある。その上で、プロセス科学基盤拡充には、各プロセスセンターと、共通基盤の拠点を強く連携させることが求められる。また、それぞれの研究開発課題の成果を活かし相乗的に進展させるために、全体を束ねる仕組み(ガバニングボードなど)が必要である。
人材育成としては、材料研究者とデータ科学者の知識・経験を融合させることが大切になる。産業界が参画する仕組みの整備、データ取扱ルールの設定なども重要な課題である。