Computer verwirrt, und der rächt sich mit besserem Lernen

Theoretische Physiker der ETH Zürich führten intelligente Maschinen bewusst in die Irre und entwickelten damit das maschinelle Lernen weiter: Sie schufen eine neue Methode, dank der Computer Daten kategorisieren können – und zwar auch dann, wenn kein Mensch eine Ahnung hat, wie eine solche Kategorieneinteilung sinnvollerweise aussehen könnte.

Wenn Computer selbstständig auf Satellitenbildern Gewässer und ihre Umrisse erkennen oder beim fernöstlichen Brettspiel Go einen der weltbesten professionellen Spieler schlagen, dann arbeiten im Hintergrund lernfähige Algorithmen. Programmierer haben diese zuvor während einer Trainingsphase mit bekannten Beispielen gefüttert: Bilder von Gewässern und von Land beziehungsweise bekannte Go-Spielverläufe, die in Turnieren zum Erfolg oder Misserfolg geführt haben. Ähnlich wie sich die Nervenzellen in unserem Gehirn während Lernprozessen neu vernetzen, sind auch die speziellen Algorithmen in der Lage, sich während der Lernphase anhand der ihnen präsentierten Beispiele anzupassen. Bis sie schliesslich selbständig auch auf unbekannten Fotos Gewässer von Land unterscheiden können sowie erfolgreiche von erfolglosen Spielverläufen.

Solche sogenannte künstliche neuronale Netzwerke kamen beim maschinellen Lernen bisher dann zum Einsatz, wenn das Unterscheidungskriterium bekannt ist: Man weiss, was ein Gewässer ist und welches in vergangenen Go-Turnieren die erfolgreichen Spielverläufe waren.

Den Weizen vom Spreu trennen

Nun haben Wissenschaftler aus der Gruppe von Sebastian Huber, Professor für theoretische Festkörperphysik und Quantenoptik an der ETH Zürich, die Anwendungen solcher neuronaler Netzwerke erweitert: Sie entwickelten eine Methode, mit der sich beliebige Daten nicht nur kategorisieren lassen, sondern die auch erkennt, ob es in komplexen Datensätzen überhaupt Kategorien gibt.

Solche Fragestellungen gibt es in der Wissenschaft zuhauf: Die Methode könnte für die Auswertung von Messungen an Teilchenbeschleunigern oder von astronomischen Beobachtungen interessant werden. Physiker können damit aus ihren oft unüberschaubaren Messdaten die vielversprechendsten Messungen herausfiltern. Pharmakologen könnten aus umfangreichen Moleküldatenbanken jene Moleküle aussieben, die mit einer gewissen Wahrscheinlichkeit eine bestimmte pharmazeutische Wirkung oder Nebenwirkung haben. Und Datenwissenschaftler könnten damit riesige ungeordnete Datenwulste ordnen und daraus verwertbare Informationen gewinnen (Data-Mining).

Grenze gesucht

Die ETH-Forscher wandten ihre Methode unter anderem an einem intensiv erforschten Phänomen der theoretischen Physik an: einem sogenannten Viel-Teilchen-System von wechselwirkenden magnetischen Dipolen, das nie – auch langfristig nicht – in einen Gleichgewichtszustand fällt. Solche Systeme wurden jüngst beschrieben. Allerdings ist nicht im Detail bekannt, welche quantenphysikalischen Eigenschaften ein Viel-Teilchen-System davor bewahren, in einen Gleichgewichtszustand zu fallen. Insbesondere ist unklar: Wo genau liegt die Grenze zwischen Systemen, die in einen Gleichgewichtszustand fallen, und anderen, die das nicht tun?

Um diese Grenze zu finden, entwickelten die Wissenschaftler das «So tun als ob»-Prinzip: Sie nahmen Daten von Quantensystemen zur Hand. Anhand eines Parameters zogen sie eine beliebige Grenze, mit der sie die Daten in zwei Gruppen einteilten. Dann trainierten sie ein künstliches neuronales Netzwerk, indem sie dem Netzwerk vortäuschten, die eine Gruppe falle in einen Gleichgewichtszustand, die andere nicht. Die Forscher tat also so, als ob sie diese Grenze kennen würde.

Wissenschaftler verwirrten das System

Insgesamt trainierten sie das Netzwerk unzählige Male, jeweils mit einer anders gewählten Grenze, und sie testeten nach jedem Training, wie gut das Netzwerk Daten zu sortieren vermag. Das Ergebnis: In vielen Fällen bekundete das Netzwerk Mühe, die Daten so einzuteilen, wie von den Wissenschaftlern vorgegeben, in einigen Fällen war die Einteilung in die zwei Gruppen jedoch sehr präzis.

Die Forscher konnten zeigen, dass diese Sortierleistung vom Ort der gewählten Grenze abhängt. Evert van Nieuwenburg, Doktorand in der Gruppe von ETH-Professor Huber, erklärt das so: «Indem ich für das Training eine Grenze wähle, die stark neben der tatsächlichen Grenze liegt (die ich nicht kenne), leite ich das Netzwerk fehl. Ein auf diese Weise letztlich falsch trainiertes Netzwerk kann Daten nur schlecht einteilen.» Wählt man zufällig jedoch eine Grenze, der nahe der tatsächlichen liegt, erhält man einen leistungsstarken Algorithmus. Indem die Forschenden die Leistung des Algorithmus‘ bestimmten, konnten sie die Grenze eruieren zwischen Quantensystemen, die in ein Gleichgewicht fallen, und solchen, die das nie tun: Die Grenze liegt dort, wo die Sortierleitung des Netzwerks am grössten ist.

Die Tauglichkeit ihrer neuen Methode bewiesen die Forscher ausserdem mit zwei weiteren Fragestellungen der theoretischen Physik: topologischen Phasenübergängen in eindimensionalen Festkörpern sowie dem Ising-Modell, das den Magnetismus im Innern von Festkörpern beschreibt.

Kategorisierung ohne Vorwissen

Die neue Methode lässt sich vereinfacht auch mit einem Gedankenexperiment veranschaulichen, in dem wir rote, rötliche, bläuliche und blaue Kugeln in zwei Gruppen einteilen möchten. Wir nehmen an, dass wir keine Vorstellung davon haben, wie eine solche Einteilung sinnvollerweise aussehen könnte.

Nimmt man nun ein neuronales Netzwerk und trainiert es, indem man ihm sagt, die Trennlinie sei irgendwo im roten Bereich, verwirrt man damit das Netzwerk. «Man versucht dem Netzwerk beizubringen, blaue und rötliche Kugeln seien dasselbe, und verlangt von ihm, rote von roten Kugeln zu unterscheiden, was es schlicht nicht zu leisten vermag», sagt ETH-Professor Huber.

Setzt man die Grenze hingegen im violetten Farbbereich, lernt das Netzwerk einen tatsächlich existierenden Unterschied und sortiert die Kugeln in eine rote und blaue Gruppe. Dass die Trennlinie im violetten Bereich liegen sollte, muss man dabei nicht im vornherein wissen. Indem man die Sortierleistung bei verschiedenen gewählten Grenzen vergleicht, findet man diese Grenze auch ohne Vorwissen.

Leberzellen in der Identitätskrise

Leberzellen lassen sich durch die Aktivierung eines einzigen Gens zu Vorläuferzellen der Bauchspeicheldrüse umprogrammieren. Dies konnte jetzt ein Forschungsteam vom Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) an Mäusen zeigen und in Nature Communications veröffentlichen. Eine wirksame und breit anwendbare Zelltherapie für Diabetes-Patienten rückt damit näher. Bei Menschen, die unter Diabetes Typ I leiden, gehen die Inselzellen der Bauchspeicheldrüse aufgrund einer unheilbaren Autoimmunreaktion zugrunde. Ohne Inselzellen produziert der Körper das Hormon Insulin nicht mehr, der Blutzuckerspiegel steigt und es kommt zum Diabetes. Die Erkrankten müssen sich lebenslang Insulin spritzen.

Diesen Menschen könnten eines Tages neue Bauchspeicheldrüsen-Zellen aus der Retorte helfen. Daran arbeitet MDC-Gruppenleiterin und Stammzellforscherin Dr. Francesca Spagnoli, die Leberzellen von Patienten zu Zellen der Bauchspeicheldrüse umprogrammieren will.

Spagnolis Forschungsteam ist nun erstmals gelungen, Leberzellen zuerst in ein weniger spezialisiertes Entwicklungsstadium zu verwandeln, sie also in eine Art „Identitätskrise“ zu stürzen. Danach konnten die Forschenden diese Zellen schrittweise zu Zellen mit Eigenschaften der Bauchspeicheldrüse umerziehen – und zwar mit Hilfe eines einzelnen Gens.
Nuria Cerdá-Esteban et al. (2017): “Stepwise reprogramming of liver cells to a pancreas
progenitor state by the transcriptional regulator Tgif2.” Nature Communications. doi:10.1038/ncomms14127

Fortschritte bei Tollwut- und Staupeimpfung

Meine laotische Hündin Pipa hatte schon die erste Staupe-Impfung gehabt, als sie sich dennoch infizierte. Sie schaffte es so gerade eben, mit viel Antibiotika und auch viel Glück. Umso mehr freue ich mich über die Fortschritte, die in der Impfforschung gemacht werden.

Pipa

Derzeit verfügbare Lebend-Impfstoffe gegen Staupe bei Tieren sind effektiv und enthalten abgeschwächte Impfviren. In sehr empfindlichen Tierarten können sie aber zu Erkrankungen führen. Forscher des Paul-Ehrlich-Instituts und der Thomas Jefferson University haben einen auch für empfindliche Tierarten sicheren Inaktivat-Impfstoff entwickelt, der im Tierversuch gleichzeitig gegen Staupe und Tollwut schützt. Der neue Impfstoff besteht aus einem Mix von zwei rekombinanten inaktivierten Tollwutviren inklusive Tollwut-Glykoprotein und je einem von zwei Glykoproteinen des Staupeerregers.

Tollwut und Staupe gehören zu den gefährlichsten Virusinfektionen bei Karnivoren (fleischfressenden Tieren) und führen häufig zum Tod. Das Tollwutvirus kann durch Biss auch auf Menschen übertragen werden. Es greift das Nervensystem an und führt zu tödlichen Erkrankungen. Bei den Tollwutimpfstoffen handelt es sich um inaktivierte Impfstoffe, auch als Inaktivat-Impfstoffe bezeichnet, mit sehr gutem Sicherheitsprofil und hoher Stabilität. Zur Impfung gegen die Staupe, die eine masernähnliche Erkrankung hervorruft, werden Lebend-Impfstoffe eingesetzt, die abgeschwächte Staupeviren enthalten. Diese vermehren sich im geimpften Tier in gewissem Umfang weiter und können bei sehr empfindlichen Tierarten zur schweren Erkrankung führen.

Forscher des Paul-Ehrlich-Instituts um Prof. Dr. Veronika von Messling, Leiterin der Abteilung Veterinärmedizin, und der Thomas Jefferson University um Prof. Dr. Matthias Schnell haben das für Impfungen eingesetzte Tollwutvirus gentechnisch verändert, so dass es auf seiner Oberfläche neben dem Glykoprotein des Tollwuterregers zusätzlich eines der beiden Glykoproteine des Staupevirus trägt. Gegen diese Glykoproteine ist die schützende Immunantwort gerichtet. Die rekombinanten Viren wurden dann aufgereinigt und inaktiviert, um den Tollwutimpfstoffen ähnliche Impfstoffkandidaten zu erzeugen.

In Experimenten mit Frettchen stellten die Forscher zunächst fest, dass eine einzelne Impfung ausreicht, um schützende Antikörpertiter gegen Tollwut zu erzeugen. Vor Staupe waren nur Tiere geschützt, die mit einem Mix aus inaktivierten Tollwutviren mit je einem der Staupe-Glykoproteine geimpft worden waren. Der Mix-Impfstoff enthielt somit das Tollwutvirus-Glykoprotein und beide Staupevirus-Glykoproteine. Die Forscher schließen daraus, dass nur die Immunantwort gegen beide Staupevirus-Glykoproteine zum Schutz vor Staupe führt.

Originalpublikation

Da Fontoura Budaszewski R, Hudacek A, Sawatsky B, Krämer B, Xiangping Y, Schnell MJ, von Messling V (2017): Inactivated Recombinant Rabies Viruses Displaying Canine Distemper Virus Glycoproteins Induce Protective Immunity Against Both Pathogens.
J Virol Feb 01 [Epub ahead of print].
doi: 10.1128/JVI.02077-16