医療とセキュリティ分野での活躍が期待されるコンピュータビジョンアルゴリズム
Algo-vision:未来を覗いてみる
アルゴリズムにより人間の視覚システムの限界が拡大することで、医療画像からセキュリティにいたるまで、産業業態は変わっていくかもしれません。

人間にとって見ることほど確かなことはありません。視覚はすべての感覚の中で最も高度とされているからでしょう。実際、あまりにも視覚が高度化した感覚であるため、脳の40%は視覚データの処理に費やされています。
科学者が人間の視覚のような機能を備えた人工視覚システムを作成する方法を見つけることができれば、それは大きな技術革新を意味します。コンピュータは、労働集約的な仕事の実行はもちろん、正常な組織の中の個々の癌細胞の特定など、より複雑なプロセスにおいても人間の目に置き換わることができるでしょう。またそのようなシステムは、視覚障害のある人々が「見る」ために役立つこともありえます。
物を見るとき、私たちの目は、色や濃淡などの生の視覚情報だけを検出します。それを私たちの脳がデータを処理し、意味のある一貫した情報に変換します。
しかし問題は、人間の脳が視覚的なデータを分析してそれを理解することを可能にするメカニズムの多くが、脳研究者にとって謎のままであるということです。
それでも、コンピュータ・ビジョン科学分野は急速に進歩しています。ワイツマン科学研究所(Weizmann Institute of Science)では、最終的にコンピュータが人間の目の機能を模倣できるようにする数学的アルゴリズムを開発しています。この技術は、人間の脳に関する解明に役立つ可能性があります。それが叶わずとも、人工的な視認システムを構築するのに引き続き有用かもしれません。
私たちは、自然画像の基本原理の1つが効率性であることを発見しました。画像は多くの小さな反復要素で構成されており、周囲の背景にある一連の小さな繰り返し要素に基づいて、画像から欠落している情報ギャップを埋めるために「知的な推測」を行うアルゴリズムを考案しました。
私たちの考案したアルゴリズムは、解像度に関する問題のため、或いは障害物のために部分的に遮られたことによってカメラが明確に記録できなかったシ光景に対して視覚情報を再構成することができます。
下の画像では、右端の写真は、左のオリジナル写真がバンジージャンプでジャンパーがいない場合どのように見えるのかをコンピュータで生成したものです。

このアルゴリズムは、統計的にそこに存在するであろうものに基づいて、未知の背景・景色を現実的に表現しました。それは、様々な視覚尺度で写真に含まれる反復要素を分析することによって行われます。
このアルゴリズムはすでに商業的に使用されています。アドビ社のフォトショップ(Adobe Photoshop)における「コンテンツに応じて塗り潰す」機能の基礎部分です。ユーザーは、周囲の部分から入手したデータに基づいて画像の欠落部分を埋めるシステムを使用して、画像から障害物を削除したり、破損した部分を復元したり、切り抜かれた画像の境界を拡張することができます。

人工視覚システムは大きな可能性を秘めています。私たちのアルゴリズムは、日常生活のより広い側面に適用することができます。たとえば、セキュリティカメラはビジュアルデータを記録するだけでなく、通常と違う動きが起きているかどうかを警告するために使用することもできます。また、製造業においては欠陥製品の欠陥部分を特定するためのコンピュータベースの手段ともなりえます。

また一方で、コンピュータベースの視覚システムは、患者の医療診断を強化することができます。私たちのプロジェクトの1つにおいては、MRIと顕微鏡データの解像度を高めるために繰り返し要素の原則を適用しています。この一連の研究は医療画像診断の改善につながり、世界中の患者、医師、研究者に恩恵を与えるでしょう。
フランスの芸術家、ポール・ゴーギャン(Paul Gauguin)は、「私は目を閉じて見ることができる」と言っています。遠くない未来において、私たちが目を閉じている傍ら、コンピュータが私たちに代わって物を見ることが実現するかもしれません。