画像分類

画像分類は、その利用目的に応じて画像をどのクラスに分類するかという識別問題と捉えることができます。領域ベースの画像分類は、主にリモートセンシングの分野での土地被覆分類などが該当し、教師付き分類と教師なし分類の2種類がありあす。教師付き分類では、分類コードがラベル付けされた学習データを用いて画像を分類します。一方、教師なし分類では、事前のラベル付けは行わず、データ自体が持つ特徴量の分布に基づいて複数のクラスに分類します。従来から行われてきた分類手法としては、統計的機械学習の識別器としてのニューラルネットワーク、SVM(サポートベクターマシン)、k近傍識別器、ベイズ分類などがあり、機械学習で得られる大量の学習データを用いて分類することができるようになります。

画像のカテゴリ分類としては、最近では、物体認識が行われるようになり、例えば、食事のシーンを撮影して、対象物を画像分類で認識して健康管理に役立てるなどのサービスも始まっています。この背景には、ディープラーニングに代表される人工知能研究が目覚ましい成果を挙げている点が挙げられます。この画像分類では、主にCNN(畳み込みニューラルネットワーク)が用いられますが、大量の学習データを必要とし、その入力された画像データが第1層からより深い層へ伝達される過程と、その逆伝搬の過程で各層にて学習が繰り返され、識別器としての機能を果たすようになります。

(2016年10月26日 初稿)

English

Image classification

定義

画像分類とは、画像を何らかの主題に基づき分類する処理方法のことを意味します。画像分類は、分類処理の性質上、画像を画素単位の領域として複数のラベルに分割するものと、画像自体を1つの単位として複数のカテゴリに分類するという2種類の異なる意味で使われることが多く見受けられます。前者の領域ラベル分割も、後者の画像カテゴリ分類も、意味を持った属性情報としてのクラスを付与することが最大の目的になります。