Künstliche Intelligenz kombiniert
In der Astrophysik klassifizieren künstliche Intelligenzen (KIs) Galaxien, Sterne, und andere Objekte. Sie helfen dabei, Teleskope zu steuern und deren Daten zu analysieren. Sie prozessieren Datenmengen, die kein Mensch auch nur ansatzweise bewältigen würde. Zudem werden KIs auch außerhalb der Forschung vermehrt in fast allen Bereichen menschlichen Lebens eingesetzt, von Streamingdiensten, um Nutzer mit passgenauen Vorschlägen zu versorgen, über das autonome Fahren, bis hin zu medizinischen Diagnosesystemen.
Das Trainieren einer KI ist aufwendig und teuer. Ein hinreichend großer und vorab klassifizierter Datensatz muss erstellt werden. Anhand dessen kann ein neuronales Netz lernen eine bestimmte Aufgabe zu bewältigen, beispielsweise das Schätzen des Alters einer abgebildeten Person. Eine andere Anwendung ist das Generieren realistischer Beispiele, welche die Eigenschaften der Trainingsdaten aufweisen, beispielsweise hochqualitative Porträts. Während des intensiven Lernprozesses internalisieren Netzwerke charakteristische Eigenschaften und Konzepte der studierten Gesichter oder anderer Objekte. Die Netzwerke werden so zu Vertretern des trainierten Konzepts. Die so erlernten Einsichten der Netze für andere Aufgaben verfügbar zu machen, ist Gegenstand aktueller KI-Forschung.
Jakob Knollmüller und Torsten Enßlin, zwei Forschern der Informationsfeldtheoriegruppe am Max-Planck-Institut für Astrophysik in Garching, ist es nun gelungen, bereits trainierte Netzwerke so zu verbinden, dass sie gemeinsam Aufgaben bewältigen, die sie für sich genommen nicht geschafft hätten. Die Art der Kombination ist vollkommen generisch und kann für viele Anwendungen genutzt werden, ohne dafür ein neues Netz trainieren zu müssen. Dabei wird ein sogenanntes generatives Netzwerk durch intelligente Kombination mit einem oder mehreren klassifizierenden Netzwerken dazu gebracht Beispiele zu erzeugen, welche die geforderten Eigenschaften erfüllen.
So kann beispielsweise eine KI zur Erzeugung von Gesichtern mit KIs zur Bestimmung von Alter und Geschlecht von fotografierten Personen kombiniert werden. Die so kombinierte KI kann dann aus einem unvollständigen und verrauschten Bild eines Gesichts (Abb.1) mögliche Ansichten dieser Person erzeugen (Abb.2). Da bei Aufgaben dieser Art meist keine Sicherheit über die richtige Lösung bestehen kann, sind diese unterschiedlichen Ansichten die Antwort der KI. Aus ihnen kann dann nach Bedarf ein gemitteltes Bild oder dessen Unsicherheit berechnen werden (Abb. 3).
Für das Zusammenfügen der verschiedenen Arten von Information nutzt die kombinierte KI die sogenannte bayesianische Logik, die Wahrscheinlichkeiten anstelle des binären „Richtig“ oder „Falsch“ der mathematischen Logik verwendet. Diese bayesianischen Wahrscheinlichkeiten erlauben die Nutzung unsicheren Wissens, wie in dem Beispiel die Information, dass es sich bei der zu rekonstruierenden Person vermutlich um eine etwa 30-jährige Frau handelt. Insbesondere der Umgang mit unvollständigen und verrauschten Daten, wie dem groben Eingabebild, wird durch bayesianische Wahrscheinlichkeiten optimal unterstützt. Die verschiedenen spezialisierten neuronalen Netzwerke, die zur Lösung einer Aufgabe herangezogen werden sollen, werden dabei selber als Wahrscheinlichkeitsfunktionen eingesetzt.
Die Idee, mittels bayesianischer Logik KIs zu kombinieren, ist an sich nicht neu. Allerdings standen einer Realisierung bisher technische Schwierigkeiten entgegen. Überwinden konnten die Garchinger Forscher diese Hürde dank eines neuen Verfahrens, welches sie ursprünglich zur verbesserten Bildrekonstruktion in der Astronomie entwickelt hatten. Dieses Metric Gaussian Variational Inference (MGVI) genannte Verfahren kann sehr große Rekonstruktionen durchführen, mit Abermillionen von unbekannten Größen, ohne dabei deren mannigfaltige Verflechtungen aus den Augen zu verlieren. Eine erste Anwendung von MGVI lagen in der dreidimensionalen Rekonstruktionen der Verteilung galaktischen Staubs mittels Informationsfeldtheorie (siehe Highlight: Februar 2019).
Nun haben die Forscher gezeigt, wie MGVI es erlaubt, einzelne, hoch spezialisierte KIs zu logisch schlussfolgernden und damit vielseitig einsetzbaren Intelligenzen zu kombinieren. Auch können damit nun bildgebende Verfahren in Astronomie, Medizin und in anderen Bereichen direkt auf in KIs gespeichertes Expertenwissen zurückgreifen, ohne dass diese KIs erneut auf die Eigenheiten eines anderen Messinstruments trainiert werden müssen. Diese Experten-KIs können dann in verschiedenen Spezialanwendungen ihr Wissen beisteuern, zum Beispiel zur Tumorerkennung in medizinischer Bildgebung.