Deep Learningとの比較
少量のデータでも高精度な判断が可能であることの実証
Wide Learning™には、大量の学習データを必要とせず手元にある少量のデータでAIを稼働させることができるという特徴があります。
これは、Deep Learningでは得ることができないメリットです。
もちろん、Wide Learning™でもデータは多ければ多い方が、精度も高まり新しい発見につながります。
実験1:少量データ上での比較
Deep Learningは少なくとも数千件から数万件のデータがないと、精度が上がらないと言われています。それに対して、AIで使われるDeep Learning以外の一般的な技術では、多くの場合、100件から1000件程度の少量のデータでも、実用的な精度を達成することができます。実際、少量データ上でのWide Learning™とDeep Learningとの比較実験では、Wide Learning™の方が高精度であることが分かっています(下図)。
実験2:少量ではないデータ上での比較
少量ではないデータでの比較実験でも、Deep Learningより高精度となる場合があることも分かっています(下図)。
実験方法
以下の各データセットで5-foldでの交差検証における各試行のF値の平均値で評価しました。
各データセットの各ラベルに対し、二値分類用のデータを作成し実験しました。
Deep Learningのモデルは、特徴量数と同等のノード数×5層(全結合層)を想定し、各パラメータは推奨のものを使用しました。
エポック数は、損失関数の値が収束する1000に設定しました。
実験1で使用したデータセット(※1)
乳房組織の識別:Breast Tissue Data Set
ガラスの種類の識別:Glass Identification Data Set
実験2で使用したデータセット(※1)
スペースシャトルの飛行状態の判定:Statlog (Shuttle) Data Set (shuttle.trn.Zを使用)
※1:Dua, D. and Graff, C. (2019).
UCI Machine Learning Repository.
Irvine, CA: University of California, School of Information and Computer Science.