画像認識

一般に画像認識では、画像データに写っている対象物を前景と背景に分離した上で、前景として映っている対象物が何であるかを判別します。類似の用語として画像分類がありますが、前景として抽出された部分領域に対して画像分類を実施して対象物をモノとして判定しています。この理解にも2通りの意味があり、一つはその画像が何であるかの種別を分類する方法と、もう一つはステレオカメラや動画像、画像の陰影などから物体を3次元モデルとして復元する方法です。一般に、前者を画像認識と呼び、後者は画像理解や3次元復元などと呼ばれます。

近年、デジタルカメラに搭載されている顔検出機能などで、急速に脚光を浴びるようになった画像認識技術ですが、これを応用した技術としては、これまでにもOCR(文書の自動文字読み取り)や生体情報を使った個人認証などを挙げることができます。特に、ここ数年でのディープラーニングによる技術革新は目覚ましく、一般物体認識として広く浸透するようになりました。

代表的な応用事例としては、自動車の安全運転支援があり、車載カメラ映像を用いた道路の自動白線検出によるはみ出し防止や、歩行者や障害物を検知してドライバーに注意を促すシステムなどが挙げられます。このような技術は、これまでITS(高度道路交通システム)などの分野で長期に渡り研究されてきましたが、最近では市販の自動車にも搭載されるようになりました。

(2019年01月29日 更新)
(2016年10月26日 初稿)

English

Image recognition

定義

画像認識とは、画像データを分析して、そこに写っている物体を識別すること、また、その形状を把握するなどの技術の総称です。画像認識では、画像データから、ある種の共通性のあるパターンを取り出して、そこに対象物の意味を関連付ける処理を行います。画像中に写っている特定の物体を認識、もしくは、検出することから物体認識や物体検出と同義で使われることもあります。