最終更新日:2023/08/17
画像解析の基礎知識|仕組み、活用事例・サービス、開発ツール
画像からさまざまなデータを読み取る「画像解析」はAIの発展やクラウドの普及に伴い、飛躍的な進化を遂げました。スマートフォンの顔認証や画像検索サービスなどはすでに私たちの生活でもお馴染みとなっていますね。
このテキストでは、画像解析の基礎知識として、画像解析の歴史やAI画像解析の仕組み、実際に活用されている事例などをご紹介しながら、画像解析についての理解を深めていきます。
INDEX
1. 画像解析の基礎知識
2. AI画像解析の仕組み
3. AI画像解析でできること|どのように活用されている?
4. AI画像解析のツールの紹介
5. まとめ
画像解析の基礎知識
|画像解析とは?画像認識との違い
「画像認識」とは画像に写っているものが何かを見分ける技術です。画像内の対象物の特徴を検出してマッチングや変換によって識別します。英語では「Image Recognition」と言います。
「画像解析」は英語では「Image analysis」となり、「analysis(解析)」とは「データの有意な規則性を発見する」ことです。画像解析とは画像に写っているものを見分けるだけではなく、意味づけや情報の取捨選択をも行うことを指します。近年、ディープラーニングによる画像認識が行われるようになり、画像認識が解析と言えるレベルまで到達したと言えるでしょう。
人間が判断した基準を採用したアルゴリズムで自動的に機械が判断を下すことなども含めて画像解析と呼ぶようですが、「画像認識」と「画像解析」はほぼ同じ意味で使われることも多く、「画像認識・画像解析」と一括りに記載されることもあります。
このテキストでは「画像認識」も「画像解析」の一部として、その歴史について解説します。
|最も古い画像認識とは?
1949年、アメリカのドレクセル大学の学生が発明した最も古い画像認識は、今も私たちの生活に欠かせないものとして存在しています。それは「バーコード」です。画像というと写真のようなものを思い浮かべる方も多く、黒いバーと空白部分の組み合わせから情報を読み取るバーコードは画像認識のイメージとかけ離れた印象を持つかもしれませんが、これも紛れもなく「画像認識」の一つです。
|テンプレートマッチングからディープラーニングへ
テンプレートマッチングとはあらかじめテンプレートとして登録された画像と対象の画像を照らし合わせ、類似性を探る手法であり、これまでは画像認識と言えばこちらが主流でした。
近年、GPUの高性能化やクラウドの普及によって、コンピュータの処理速度の問題で難しいとされていた画像認識がそれまでよりも簡単に行えるようになりました。
そこにディープラーニングの登場です。ディープラーニングは日本語で「深層学習」と訳されますが、人間が普段何気なく行っている、画像からの対象物の特定といったタスクをコンピュータに学習させる技術です。近年のA I(人工知能)の急激な進化を支えた、注目の技術です。
ディープラーニングは人間の脳にある神経細胞、ニューロンの仕組みをもとにしたシステム「ニューラルネットワーク」を基礎とした技術であり、理論としてはすでに1980年代に登場していましたが、当時のコンピュータのスペックではデータ量が足りず、認識の精度も残念ながら高いとは言えませんでした。
コンピュータの高性能化が進み、ディープラーニングのおかげでAIは著しい進化を遂げ、画像認識の精度は飛躍的に上がり、さまざまな分野で活用されるようになったのです。
次の項ではAI画像解析について解説します。
AI画像解析の仕組み
近年、著しく進化したAIによる画像解析について理解を深めていきましょう。
AIを使わない画像解析は学習能力を持たず、人間がさまざまな定義を行う必要がありましたが、AIは学習能力を持ち、自律的に考えて判断します。人が介入しないことで担当者によるバイアスをなくすことができ、自動的に高い認識精度、解析精度へと到達してくれるのがAI画像解析です。
|画像解析の種類
画像解析にはいくつかの種類があります。主に「物体分類」「シーン認識」「物体検出」「領域の検出」の4つであり、それぞれ以下のような違いがあります。
・物体分類
画像にある物体の特徴を判別し、分類を行います。例えば公園の風景から「人」「植物」「動物」というように分類します。
・シーン認識
こちらは、全体像から画像がどのような画像なのかを見分けます。例えば風景写真を「公園」「街の風景」と見分けることができるイメージです。
・物体検出
画像にある物体がどこにあるのか、何であるのかを検出します。例えばコンビニの棚のどこにビスケットがあるのかを検出する、といった具合です。
顔認識機能のついているデジタルカメラで人の顔を四角い枠で囲む、あのイメージを思い浮かべていただくとわかりやすいのではないでしょうか。
・領域の検出
物体同士の境界線を見分けます。道や壁、歩行者や車などを見分けることで自動運転に役立てるというような使い方ができます。
|AI画像解析の手法
ここでは、AIが行う画像解析の手法について解説します。
・コンピュータビジョン
AIが画像解析を行う上で、AIが認識できるデータとして画像を変換することが必要となります。これがコンピュータビジョンです。例えばサーモグラフィなどが例に挙げられます。
・画像データベース
データ化した画像を保存するのが画像データベースです。画像データはコンピュータが直接処理する形式のバイナリデータとしてサーバーに保存されますが、これはテキストデータのような検索を行うことが不可能なので、画像にメタデータを付与しておき、検索に役立てるというのが一般的な手法です。
・パターン認識
画像の中にあるパターンを認識することをパターン認識と言います。人間は景色をパッと見て「公園だ」「ベンチが2つある」「犬が3匹いるな」と認識することができますが、これは公園やベンチ、犬という風に、一定の規則や意味を持つ対象を選別すること、つまりパターンを認識できているからなのです。
これをコンピュータが行うのがパターン認識であり、ディープラーニングによって飛躍的に発展した技術でもあります。
・画像処理
画像処理とは画像の形や色合いを変えたり、情報を取り出したりといった処理全般を指す言葉です。AI画像解析においては、形が揃っていない農産物などを選別することや、車のナンバープレートを読み取ったりすることなどに役立てられている技術です。
AI画像解析でできること|どのように活用されている?
|画像解析の活用事例 / 活用シーン
AI画像解析は近年、さまざまな分野で活用するための研究がなされています。実際に実用化されているものも、まだこれからのものもありますが、この項では活用事例や研究事例をご紹介します。
・医療
レントゲンなどの画像から病気を見つけ出すのは元来医師の役目です。しかし、医師の経験値や得意分野などによってその精度は変わるため、全ての医師が同じ水準の判断を下すのはどうしても難しいのが現実でした。そこで、画像解析の技術を使ってがんなどの早期発見ができるよう、研究が進められています。
・セキュリティ
ロシアで2014年に開催されたソチ冬季オリンピックで採用された「不審者検知システム」にもAI画像解析の技術が使われていました。このシステムによって不審者の疑いがあるとされた人物の9割以上が実際に不審者として入場拒否となったそうです。
・インフラ
インフラや建築物の老朽化問題を解決すべく、コンクリートのひび割れを画像解析で自動検出するという研究が進められています。
・製造業
工場で製造された商品の不良品を発見するなど、検品にも画像解析の活用が見込まれています。
・観光
NTTドコモが実証実験に取り組んでいるのは、海外の有名な観光地と似ている日本の名所をAIで探し出す、というもの。ウユニ塩湖と似ているとしてSNSで紹介された香川県の父母ヶ浜が脚光を浴びたことから、第二の父母ヶ浜、「ジェネリック観光地」を探そうという面白い試みです。
|画像解析を活用したサービス/アプリケーション
画像解析を活用したサービスやアプリケーションは、すでに私たちの生活において身近なものとなりつつあります。多くのサービスやアプリケーションが存在しますが、ここではその一部をご紹介します。
・画像検索アプリ
Googleの画像検索アプリGoogle Lensは、AIが画像データに写っているものを認識し、検索してくれるというアプリで、商品の特定や販売しているサイトなども探してくれます。
画像だけでなく文字も認識するので、名刺を撮影して住所などの情報を保存することも可能です。
・写真加工アプリ
性別逆転加工で話題になったアプリ「FaceApp」もAIが自然に加工してくれるアプリとして人気を集めました。できるだけナチュラルに、でも盛りたいというのがセルフィーを撮るユーザーの望みでしょうから、それを叶えるさまざまな写真加工アプリが登場しています。
少し変わったところだと、「Mirror: My Emoji Face Avatar」というアプリは、写真に写っている人物をキャラクターにしたオリジナル絵文字を作ることが可能です。この絵文字はスマートフォンのキーボードから呼び出すこともできるのだとか。
・ダイエットアプリ
「あすけん」や「カロミル」といったアプリは、食事の写真を撮るだけで、メニューを自動判別してカロリーまで計算してくれるダイエットアプリです。実は筆者も「あすけん」を使ってみたことがありますが、一般的なメニューであれば画像解析の精度はかなり高い印象を受けました。
・著作権侵害発見サービス
近年、他人の画像を無断で使用する著作権侵害が話題になっていますが、「COPYTRACK」はそういった画像の不正利用を発見し、権利侵害先への請求も代行してくれるサービスです。140カ国に対応しており、登録料などは一切かからず、請求が通ったときに成功報酬を支払うシステムとなっています。
AI画像解析のツールの紹介
最後に、AI画像解析を行うことのできる代表的なツールを4つご紹介します。
|OpenCV
インテル社が開発した「Intel Open Source Computer Vision Library」が正式名称のフリーソフトが「OpenCV」です。
画像処理や画像解析、機械学習といった機能を持つC/C++ライブラリ集であり、オープンソースとなっています。
|ImageJ
フリーソフトである「ImageJ」は、化学研究の画像解析に多く使われており、生物学においては事実上の標準アプリとして使われています。オープンソースであり、ブラックボックスがないため研究に適しているのだとか。
画像処理に使われる数値を計算するためのパラメータUIが分かりやすいのが特徴です。
|R / RStudio
統計ソフトとして有名な「R」の画像処理用パッケージです。「R」での画像解析のために作られたため、Rを使いこなしている人であれば簡単に使うことができますが、「R」を使ったことがない人には少々難解かもしれません。
|AT-Image
日本人が作ったフリーソフトが「AT-Image」です。「画像処理の学習に適した実験・結果解析用ソフト」と説明されている通り、2値化やフーリエ変換などの画像処理を行うことができます。個人用に作成されたソフトとのことで、しばらく更新がされていないようですが、工学の分野で学ぶ画像処理が可能な便利なソフトです。
まとめ
AI画像解析は近年、一般の方々にとっても馴染みのある技術になってきているかと思います。それは、AI技術が進歩し、実用化に足るだけの精度に到達しているということだとも考えられます。
AI画像解析はまだまだ様々な分野・業界での活用が期待される分野です。一方で国内ではAIをはじめとする先端技術領域に通じるエンジニアは、人材確保が非常に困難となっています。もしAI、画像解析のスキルをもったエンジニアが必要であれば、グローバルに人材確保してはいかがでしょうか?今やベトナムやフィリピン、バングラデシュなど、多くのオフショア開発国で高いレベルのAIエンジニアが育成されています。
「オフショア開発. com」では、専門コンシェルジュに海外へのアウトソースについて、無料で相談することができます。「コンピュータビジョン(Open CV)に精通した技術者をグローバルに確保したい」「AIを活用したWebシステムを開発したい」…など、さまざまなお悩みやご質問・ご相談にお応えいたします。
「オフショア開発. com」は、多数のオフショア開発企業とパートナー契約を結んでおります。御社にぴったりのオフショア開発企業を無料でご紹介することもできますので、ぜひお気軽にお問い合わせください。