Bilderkennung durch verbesserte KI
Die Bilderkennung durch verbesserte KI liefert überraschend gute Resultate. Du kennst einen Baum nicht? Einfach Foto eines Blatts machen und die Google Bildersuche verwenden. Durch künstliche Intelligenz trainierte Modelle liefern in Bruchteilen einer Sekunde fast immer passende Ergebnisse. Anwendungen mit KI ändern bereits spürbar Prozesse und greifen in immer mehr Bereiche ein.
Bilderkennung durch verbesserte KI
Eigentlich ist das Thema der Bilderkennung kein neues, denn bereits seit vielen Jahren arbeiten Wissenschaftler der IT daran, die automatische Analyse von Bildern durch Computer zu verbessern. Erst in den letzten Jahren wurde dieses Unterfangen jedoch durch große Fortschritte in der Entwicklung von künstlichen Intelligenzen enorm verbessert. Was der Computer heute schon leistet und wie das Ganze funktioniert, haben wir uns genauer angesehen!
Text- und Bilderkennung in der Anwendung
Mittlerweile sind Prozesse, die sich auf die Erkennung von Inhalten in Bildern spezialisiert haben, überall in unserem täglichen Leben vorhanden. Wer zum Beispiel auf google.com mit der Bildsuch-Funktion ein Foto hochlädt und nach ähnlichen Bildern sucht, beruht seine Anfrage auf dem komplexen Algorithmus von Google zur Bilderkennung. Auch Facebook ist für seine Fähigkeit bekannt, Personen in geposteten Fotos wieder zuerkennen und dem Autor des Bildes eine Verknüpfung vorzuschlagen. Oftmals ist man verwundert darüber, dass selbst Personen im Hintergrund mühelos erkannt werden. Auf Amazon Prime Fotos wählt man aus wer aller auf dem Bild zu sehen sein soll und die Suche liefert die passenden Bilder. Auch im Gaming-Bereich findet die Bild- und Texterkennung bereits Anwendungen. Besonders in Live-Casinos wie auf casino.betfair.com ist die Technologie wichtig. Hier wird nämlich ein Croupier in einer Greenbox gefilmt und legt die realen Spielkarten auf dem Spieltisch vor sich auf. Die Szene wird abgefilmt und mit einem digital eingefügten Hintergrund live auf den Computer des Spielers übertragen. Damit das Ergebnis eines jeden Spiels direkt auf das virtuelle Spielerkonto übertragen wird, muss der Computer die Karten erkennen und ihren Wert berechnen können.
Wie funktioniert die KI?
Unser Gehirn ist in der Lage, Muster wieder zuerkennen und daraus Schlüsse zu ziehen. So ist bspw. jedes Gesicht ein Muster, das nach einem ähnlichen Schema aufgebaut wird. Sehen wir einen Mund, eine Nase und zwei Augen, weiß unser Gehirn, dass es sich um ein Gesicht handelt. Ein ähnliches Prinzip muss nun der Computer lernen. Dazu werden zwei Lernmethoden eingesetzt: einerseits das maschinelle Lernen und andererseits Deep Learning. Das maschinelle Lernen basiert auf vorgefertigten Algorithmen und Parametern, mit denen eine KI sich selbst verbessern kann. Gibt man ihr neue Daten, kann sie diese verarbeiten und anhand des gelernten Wissens analysieren. Aus diesem Prozess entsteht dann wieder neues Wissen. Hat die KI bspw. zahlreiche Gesichter auf Fotos gesehen und analysiert, fällt es ihr immer leichter, andere Gesichter zu erkennen. Bei Deep Learning spricht man von einer Lernmethode, bei der sich die KI jene Informationen aus der Big Data holt. Das bedeutet, dass der Computer auf soziale Netzwerke, Datenbanken und Co. zugreift, um aus der unglaublichen Informationsdichte des Internets zu lernen. Dazu müssen jedoch Systeme vorhanden sein, die große Mengen an Daten speichern können, denn der Prozess ist sehr aufwendig und datenintensiv. Mittlerweile gibt es bereits so ausgereiften Systeme, dass damit täuschend echt aussehende Gesichter von einem Computer erstellt werden können. Die Ergebnisse der erfolgreichen KI von Nvidia können auf vice.com bewundert werden. Nur dank der enormen Fülle an analysierten Fotos wurde dieser Fortschritt möglich.
Fazit
Bild- und Texterkennungen werden bereits in zahlreichen Bereichen des täglichen Lebens eingesetzt. Wer auf Facebook Freunde automatisch markiert oder die Google-Bildsuche per Fotoupload nutzt, greift bereits auf die intelligenten Systeme zu. In den nächsten Jahren dürfen wir in diesem Bereich jedoch noch große Veränderungen erwarten. Täuschend echte Videos, die künstlich erstellt werden, sind dabei der nächste Schritt.