Deep Learning – Das umfassende Handbuch
In den letzten Wochen habe ich mit intensiv mit dem Buch „Deep Learning – Das umfassende Handbuch“ befasst. In diesem wird der aktuelle Stand eines Bereichs der Künstlichen Intelligenz theoretisch aufbereitet. Als Leser darf man sich eine ausführliche Wissensansammlung dazu erwarten.
Deep Learning – Das umfassende Handbuch
Ganze 912 Seiten dick ist das Deep Learning Handbuch. Trotzdem liegt es gut in der Hand, ich durfte die eBook Version durchlesen. Das Buch „Deep Learning – Das umfassende Handbuch“ gibt es vom mit-Verlag sowohl gedruckt als auch digital. Nachdem der Verlag seit kurzem auf Einschweiß-Folien verzichtet und fast alle Bücher klimaneutral druckt war es selbstverständlich, auch mal ein eBook zu „testen“.
Als Softwareentwickler hat man aktuell die Herausforderung sich gleich mit 3 großen Themen beschäftigen zu dürfen. Die Buzzwords dieser Tage sind Blockchain, Clound Services und KI. Mit diesem Fachbuch kann man sich über eines dieser Thema im speziellen zum Deep Learning Fachbereich der künstlichen Intelligenz fortbilden.
Vorwort zum Buch
Das Buch ist frei verfügbar. Man findet es auf der deeplearningbook.org Webseite. Die einzelnen Kapitel sind dort als HTML Seiten aufzurufen und auf Englisch. Wegen dem Vertrag mit dem mitp Verlag darf kein PDF zur leichten Verbreitung angeboten werden. Aus diesem Grund ist die auf deutsch übersetze und lektorierte Ausgabe zu empfehlen.
Einleitung
In der Einleitung erfährt man ein paar Details zu Deep Learning und über dessen Geschichte. Obwohl die Künstliche Intelligenz seit ein paar Jahren einen Hype erlebt gehen die Grundlagen dafür in die Urzeit der Computer zurück. Viele Theorien wurden bereits in den 40er und 50er Jahren des 20. Jahrhunderts formuliert. Die Mathematik dahinter ist oft noch mal 100 Jahre älter.
Einteilung ist alles
Das Buch ist in 3 Kapiteln unterteilt:
- Angewandte Mathematik und Grundlagen für das Machine Learning
In diesem Kapitel bekommt man einen Crash Kurs zu linearer Algebra und Wahrscheinlichkeitsrechnung. Beides sind die minimale Grundlage jedes Deep Learning Algorithmus. Spannend wird es dann in den Machine Learning Grundlagen, oder weißt du schon wie Baysssche Statistik, Maximum-Likelihood-Schätzung oder das stochastische Gradientenabstiegsverfahren funktioniert? - Tiefe Netze: Zeitgemäße Verfahren
Dieses Kapitel beginnt mit einem Praxisbeispiel. Mittels Deep Learning wird das XOR gelernt. Weiter geht es dann mit Regularisierung, CNNs, RNNs, praxisorientierte Anwendungen. Diese Kapitel sind oft als Nachschlagewerk sinnvoll, da es sich um die aktuell verwendeten Verfahren handelt. - Deep-Learning-Forschung
Im letzten Kapitel werden zahlreiche Ansätze vorgestellt die noch in den Bereich der Forschung fallen. Deep Learning ist ein dynamisches Umfeld in dem heute große Fortschritte erwartet werden. Lineare Faktorenmodelle, Autoencoder, Monte-Carlo-Verfahren und Approximative Inferenz sind nur einige Stichwörter aus dem Kapitel. Im letzten Teil (tiefe generierte Modelle) werden einige aus den vorgestellten Techniken erstellter Modelle vorgestellt, welche Eigenschaften diese haben und wo die Einsatzbereiche liegen.
Aufgelockert wird der Text durch viele Darstellungen, Formeln und Algorithmen. Sehr oft werden Formeln mit deren Herleitung vorgestellt. Bei Darstellungen gibt es immer eine Erklärung, manchmal sogar eine ganze Seite voll. Algorithmen werden immer in Pseudo-Code dargestellt.
Fazit
Das Deep Learning Handbuch ist wie der Name schon verrät umfassend. Es werden viele Algorithmen und Ansätze vorgestellt die aktuell im Bereich Deep Learning Anwendung finden. Dabei haben wir neben der optimalen Verwendung auch gelernt wo die Probleme liegen und welche Anwendungsfälle für Deep Learning sinnvoll sind. Mir war das Buch viel zu trocken und als Entwickler viel zu Mathematik lastig. Ich musste mir im Zuge der Rezension viele schon gelernte, aber wieder vergessene, Themen neu ansehen. Möglicherweise ist es für Mathematiker oder Statistiker einfacher zu lesen, als reiner Programmierer wird man sehr gefordert. Deep Learning ist wirklich komplex und erfordert eine grundlegende Verständnis höherer Konzepte der Analysis.
Ich denke der aktuelle Boom an KI Startups und Programmen ist nicht einem besseren Verständnis der KI zu verdanken, sondern einfach zu bedienender Frameworks und Cloud Services. Auf einem Microsoft Tech Conference Vortrag zu den Machine Learning Fähigkeiten der Azure Cloud wurde das besonders hervorgehoben. Heute ist es so einfach wie nie aus einer Datenbasis schnell mit bestehenden Algorithmen ein Ergebnis zu erzielen. Man kann Clound Rechenzeit nutzen um aus einer Datenbasis Lösungen zu erstellen und interaktiv mit Werten und Algorithmen herumzuspielen. So intuitiv war Deep Learning noch nie. Selbst ohne Theorie erzielt man einen Effekt.
Empfehlung
Ich kann das Buch in Verbindung mit einem KI Cloud Service empfehlen. Die ideale Herangehensweise ist meiner Meinung nach sich mit den z.B. Azure Machine Learning Services zu beschäftigen. Immer dann, wenn man mehr zur Theorie dahinter wissen will, kann man das Buch zu Rate ziehen. Als Buch zum Lesen und dann weg implementieren ist es für mich zumindest nicht geeignet.
Was haltest du von dem Buch? Wo hattest du als Entwickler schon Kontakt mit Deep Learning? Wie gut schätzt du deine Fähigkeiten zum Thema KI ein?