|
software
|
|
|
画像分類のためのマハラノビス符号化 |
|
|
|
|
画像のカテゴリ分類問題において,識別性能を左右する最も大きな因子は,学習機会の選択ではなく,画像記述子の設計であるといっても過言ではない.画像の表現方法,すなわち特徴ベクトルの抽出方法としては,すでに大まかなパイプラインは定まりつつあるといってもよく,パイプライン上の各ステップをいかに改善していくが,現在のコンピュータビジョン分野において中心的な課題となっている.その定まりつつあるパイプラインは,符号化ステップとプーリングステップの2ステップからなる(図1).符号化の方法には,ヒストグラム符号化,フィッシャー符号化,スパース符号化などがあり,プーリングステップには,平均符号化, Max 符号化などがある.本研究では,符号化ステップにマハラノビス計量を導入することにより,分類精度の向上に成功した.
|
|
|
|
|
|
|
|
|
図1.画像分類の典型的な方法は,符号化ステップとプーリングステップの2ステップからなる. |
|
|
|
|
|
|
|
|
図2.異なる計量空間における Visual Word.この例では,6個の Visual Word が異なる計量空間において語彙集に登録されているとする.(a) 従来のフィッシャー符号化では,ユークリッド空間上に Visual Word が配置されていた.(b) 提案法の一つ,大域的マハラノビス符号化法(GMahaFV)では,マハラノビス計量空間に Visual Word をおく.(c) もう一つの提案法,局所的マハラノビス符号化(LMahaFV)は,画像パッチ空間をソフトに2つに割り,それぞれに異なる計量を与える.2つに割った空間それぞれに3つずつ Visual Word を配置している. |
|
|
|
|
|
References |
|
|
Tomoki Matsuzawa, Raissa Relator, Wataru Takei, Shinichiro Omachi and Tsuyoshi Kato, Mahalanobis Encodings for Visual Categorization, IPSJ Transactions on Computer Vision and Applications, vol 7, pp.69--73, 2015, Jul, presented at MIRU2015 as Oral Presentation. doi: 10.2197/ipsjtcva.7.1, MIRU2015 学生優秀賞. [pdf][bibtex][japanese] |
|
|
|
|
|
|
|
|
|
|
|
|
|
|