2012年に起きたディープラーニングのブレークスルー

Q.2012年に起きたディープラーニングのブレークスルーとは?

2012年にディープラーニングのブレークスルーとして最も有名なのは、AlexNetの登場 です。

背景

それまでの画像認識では、手作りの特徴量(HOG, SIFTなど)を用いた機械学習が主流でした。しかし、2012年のImageNet Large Scale Visual Recognition Challenge (ILSVRC) で、ジェフリー・ヒントン(Geoffrey Hinton)らのチームが開発したAlexNet が圧倒的な精度で優勝し、ディープラーニングの可能性を世界に示しました。

ブレークスルーのポイント

  1. 畳み込みニューラルネットワーク(CNN)の活用

    • それまでの機械学習モデルとは異なり、AlexNetは8層の深いCNNを採用。

  2. GPUによる高速学習

    • NVIDIAのGPU(GeForce GTX 580)を使用し、従来のCPUでは難しかった大規模ニューラルネットワークの学習を実現。

  3. ReLU(Rectified Linear Unit)活性化関数の採用

    • シグモイド関数やtanh関数ではなく、勾配消失問題を緩和するReLUを採用し、学習の収束を高速化。

  4. データ拡張とドロップアウトの導入

    • 過学習を防ぐためにデータ拡張(画像の回転・スケール変更など)やドロップアウト(ランダムにニューロンを無効化)を採用。

結果

  • AlexNetは、当時の最先端モデルに比べて画像認識のエラー率を約10%以上改善(26.2% → 15.3%)

  • これをきっかけにディープラーニングへの関心が急速に高まり、GoogleやFacebookなどの大手企業が研究を加速

  • その後のResNet(2015年)やTransformers(2017年)といった技術革新へとつながる基盤を築いた

この2012年のブレークスルーが、今日のAIブームの起点になったと言っても過言ではありません!