数字画像認識問題を例にとって,パターン認識の基本を説明します.まずあらかじめ0~9までの数字を書いた画像を大量に収集し,コンピュータに覚えさせます.そのうえで,入力された未知の画像を記憶していた画像と,収集済みの画像とを比較して,最も近い画像の数字を予測結果とします.この方法は,「最近傍識別器」と呼ばれています.これがパターン認識の大きな流れであり,画像同士の比較の仕方を工夫したり,既知の画像の覚えさせ方を工夫したりして,精度や効率を上げることが,何十年にもわたり機械学習やパターン認識の中心的な課題になってきました.
パターン認識および機械学習を世間に深く浸透させた技術には「サポートベクトルマシン」や「ランダムフォレスト」などがあります.これらは広く応用されているものの,機械が示した判断がどのような過程で行われたのか,利用者にはわかりづらいものでした.このような理由から,機械の判断過程が分かる方法として,先に紹介した「最近傍識別器」が好まれています.最近傍識別器ならば,誤認識したとしても,このデータに近かったから誤認識された,と利用者が知ることができるからです.
図1(a)は,従来の最近傍識別器によるパターン認識の処理過程を,顔画像による個人同定問題を例にとって,示しています.予測対象は実はB君なのですが,この場合,最も近いのはA君なので,従来の最近傍識別器はA君を認識結果にしてしまいます.本研究では,予め集めておいたデータを使って,距離の測り方を最適化することにより,このような誤認識を起こりにくいように工夫しています.このようなアプローチは,「計量学習」と呼ばれています.計量学習においては逆行列計算という重い計算が伴うアルゴリズムが定番ですが,本研究では逆行列計算を回避するアルゴリズムを開発するという成果を得ました. |