材料開発にかかる時間とコスト、人的リソースを大幅に削減 MI分野の注目ソリューション「Citrine Platform」
- 材料開発
- MI
- AI
- ../../../article/2023/02/citrineplatform.html

データマイニング(data mining)とは、大量のデータの中から未知の知識やパターンを発見すること、またそのための技術。膨大なデータの中から人間では見つけにくい傾向や関係性を明らかにする。ビジネスなどそれぞれの目的に役立てられる情報を抽出できる。具体的には、統計学、機械学習、人工知能などの技術を用いて、データの分析、分類、予測、パターン抽出などを行う。
データマイニング(data mining)とは、主に情報システム上にある大量のデータの中からコンピュータを使って情報を抽出・分析・解析し、有用な知見を得る手法を指します。機械学習や人工知能(AI)などを活用して行われ、統計学を応用してデータのパターンや相関関係、トレンドなどを探し出します。またMI(マテリアルズ・インフォマティクス)などの先端技術にも用いられており、従来の開発スピードを高速化・効率化することが可能です。
MIによるデータマイニング活用例(イメージ)
(出典)材料開発にかかる時間とコスト、人的リソースを大幅に削減MI分野の注目ソリューション「Citrine Platform」|SCSK IT Platform Navigator
データマイニングの「マイニング(mining)」とは英語で「採掘」を意味します。情報を取り出す「大量のデータ」を「鉱山」に、取り出した情報から得た「分析結果」を「掘り起こした鉱石」になぞらえていることから、この呼称となっています。
データマイニングにはさまざまな手法があります。代表的な手法は以下のとおりです。
クラスター分析(クラスタリング)は、データの類似性に基づいてグループ分けを行う手法です。例えば顧客の購買データなどを分析し、共通の属性を持つ顧客グループを特定することで、より効果的なマーケティング施策を実施することが可能となります。
顧客の購買データを分析することで、併売商品(同じバスケットに入っているものが何か)の傾向を見出す手法の総称です。複数の商品における売れ行きの関連性を分析するアソシエーション解析の一つです。
ロジスティック回帰分析は、複数の説明変数から二値(答えが2つしかない値)の目的変数(例:合格/不合格、購入/購入なし)が起こる確率を予測する統計手法です。マーケティング分野でも活用されています。
データマイニングは現在、さまざまな分野で活用されています。具体的にはマーケティング(顧客の購買傾向分析、キャンペーンの効果測定など)、製造業(品質管理、工程改善)などビジネス分野のほか、自治体などで政策立案を行う過程においての活用*1、教育機関での学習効果の分析*2などにおいても活用が進められています。
表1 各種分野におけるデータマイニングの代表的適用事例
(出典)「データマイニングと学習 」, 鷲尾隆,『計測と制御』第42巻 第6号, 2003年6月号, p481
(参考)
*1和歌山県:「EBPMに寄与するデータ利活用について」,p28
*2早稲田大学「データマイニングで英語教育はこう変わる!」
一方で、データマイニングの活用には課題もあります。
データが膨大すぎて活用しきれず、「ただデータを集めるだけになってしまった」というケースもあります。
またデータに欠損値やノイズがあると、分析結果が不正確になってしまうため、適切なデータの前処理や質の確保が必要です。そのうえ分析のためのリソースやコストもかかります。
データマイニングを活用する目的は「データを集めること」ではありません。データマイニングによって現在のビジネスなどの問題点、課題を見つけ出し解決すること、成果を上げることが目的です。そのため安易にただデータを集めるのではなく、目的に合った適切なデータを集め、適した分析方法を用いることが重要になります。
データマイニングを効果的に活用するには、統計学や機械学習などの専門知識が必要です。データ分析を専門に行う担当部署の設置や専門職の人材採用を行う必要があります。しかしデータマイニングに精通している人材となると、すぐに採用するのは難しいのが現状といえます。自社での採用が難しい場合は、アウトソーシングという方法もあります。