Einsatz visueller Computeralgorithmen in der Medizin und der Sicherheitsbranche
Algovision: ein Blick in die Zukunft
Algorithmen versprechen, die Grenzen des menschlichen Sehens auszuhebeln, und könnten verschiedenste Bereiche von der medizinischen Bildgebung bis hin zur Sicherheitsbranche verändern.

Der Mensch glaubt nur, was er mit eigenen Augen sieht. Deshalb ist das Sehen wahrscheinlich auch der ausgefeilteste unserer Sinne. So ausgefeilt, dass 40 Prozent unseres Gehirns allein der Verarbeitung visueller Daten gewidmet sind.
Wenn es Wissenschaftlern gelänge, künstliche visuelle Systeme mit menschenähnlichen Fähigkeiten zu entwickeln, wäre das ein enormer technologischer Durchbruch. Computer wären dann in der Lage, das menschliche Auge zu ersetzen und sowohl einfache, aber arbeitsintensive Aufgaben als auch komplexere Prozesse wie etwa die Erkennung einzelner Krebszellen inmitten von gesundem Gewebe zu übernehmen. Solche Systeme könnten sogar blinden Menschen helfen, wieder zu „sehen“.
Wenn wir sehen, nehmen unsere Augen lediglich grobe visuelle Merkmale wie Farben und Schattierungen wahr. Erst unser Gehirn verarbeitet die Daten und verwandelt sie in aussagekräftige und kohärente Informationen.
Das Problem ist, dass viele der Mechanismen, die es dem menschlichen Gehirn ermöglichen, visuelle Daten zu analysieren und ihnen Sinn zu verleihen, Hirnforschern weiterhin Rätsel aufgeben.
Dennoch werden im Bereich des maschinellen Sehens rasante wissenschaftliche Fortschritte gemacht. Am Weizmann-Institut für Wissenschaften entwickeln wir mathematische Algorithmen, die Computer früher oder später in die Lage versetzen werden, die Funktionen des menschlichen Auges zu imitieren. Diese Technologie könnte uns sogar helfen, das menschliche Gehirn besser zu verstehen. Doch selbst wenn dies nicht der Fall sein sollte, könnte sie zur Herstellung künstlicher visueller Systeme genutzt werden.
Wir haben herausgefunden, dass eines der Grundprinzipien natürlicher Bilder Effizienz ist. Bilder bestehen aus einer grossen Zahl winziger, sich wiederholender Elemente, und wir haben einen Algorithmus entwickelt, der „intelligente Vermutungen“ anstellen kann und Informationslücken in einem Bild auf Grundlage einer Reihe solcher winzigen, sich wiederholenden Elementen im umliegenden Hintergrund auffüllt.
Unser Algorithmus kann visuelle Informationen einer Szene rekonstruieren, die die Kamera nicht richtig aufnehmen konnte, weil es Probleme mit der Auflösung gab oder uns Objekte teilweise den Blick versperren.
Unten sehen Sie drei Bilder. Das Foto ganz rechts ist eine computergenerierte Version davon, wie das Originalbild – links – ohne den Bungeespringer ausgesehen hätte.
Der Algorithmus hat den unbekannten Teil der Szene im Hintergrund auf Grundlage dessen, was sich der statistischen Wahrscheinlichkeit nach dort befindet, realistisch rekonstruiert. Dazu hat er die sich wiederholenden Elemente, die in dem Foto enthalten sind, auf unterschiedlichen visuellen Skalen analysiert.
Dieser Algorithmus wird bereits kommerziell genutzt. Er bildet die Grundlage der Funktion „Inhaltssensitives Füllen“ in Adobe Photoshop. Mithilfe eines Systems, das die fehlenden Teile eines Bildes basierend auf den in der Umgebung vorhandenen Daten auffüllt, können Benutzer Objekte aus einem Bild entfernen, einen beschädigten Bereich wiederherstellen oder die Grenzen eines abgeschnittenen Bildes erweitern.
Künstliche Visualisierungssysteme haben grosses Potenzial. Wir könnten unsere Algorithmen noch auf viele weitere Aspekte unseres Alltags anwenden. Mit ihrer Hilfe könnten beispielsweise Sicherheitskameras nicht nur visuelle Daten aufzeichnen, sondern gleichzeitig auch Alarm schlagen, wenn ungewöhnliche Aktivitäten stattfinden. Hersteller von Produkten könnten sie als Hilfsmittel einsetzen, um auf computergestützte Weise Mängel zu erkennen.
Anderenorts könnten computergestützte visuelle Systeme die medizinische Diagnostik verbessern. In einem unserer Projekte beschäftigten wir uns damit, das Prinzip der sich wiederholenden Elemente so anzupassen, dass damit die Auflösung von MRT- und Mikroskopie-Daten erhöht werden kann. Dieser Forschungszweig könnte zu einer besseren diagnostischen Bildgebung führen und so Patienten, Ärzten und Forschern weltweit von Nutzen sein.
Der französische Maler Paul Gauguin sagte einst: „Ich schliesse meine Augen, um zu sehen.“ In nicht allzu ferner Zukunft könnten wir vielleicht tatsächlich unsere Augen schliessen und die Seharbeit Computern überlassen.