画像認識

一般に画像認識では、画像データに写っている対象物を前景と背景に分離した上で、前景として映っている対象物が何であるかを判別します。類似の用語として画像分類がありますが、前景として抽出された部分領域に対して画像分類を実施して対象物をモノとして判定しています。この理解にも2通りの意味があり、一つはその画像が何であるかのシンボルとして分類する方法と、もう一つはステレオカメラや動画像、画像の陰影などから物体を3次元モデルとして復元する方法です。一般に、前者を画像認識と呼び、後者は画像理解や3次元復元などと呼ばれます。

近年、デジタルカメラに搭載されている顔検出機能などで、急速に脚光を浴びるようになった画像認識技術ですが、これを応用した技術としては、これまでにもOCR(文書の自動文字読み取り)や生体情報を使った個人認証などを挙げることができます。特に、ここ数年でのディープラーニングによる技術革新は目覚ましく、一般物体認識として広く浸透するようになりました。

代表的な応用事例としては、自動車の安全運転支援があり、車載カメラ映像を用いた道路の自動白線検出によるはみ出し防止や、歩行者や障害物を検知してドライバーに注意を促すシステムなどが挙げられます。このような技術は、これまでITS(高度道路交通システム)などの分野で長期に渡り研究されてきましたが、最近では市販の自動車にも搭載されるようになりました。

(2016年10月26日 初稿)

English

Image recognition

定義

画像認識とは、画像データを分析して、そこに写っている物体を識別すること、また、その形状を把握するなどの技術の総称です。画像認識では、ピクセルという濃淡値の2次元配列に格納された画像データから、ある種の共通性としてのパターンを取り出して、そこから対象物の意味を関連付けるという処理としてパターンの認識を行います。画像中に写っている物体を認識することから物体認識や物体検出と同義で使われることもあります。