Künstliche Intelligenz könnte großes Geheimnis der Biologie gelöst haben

Johannes Giesler
·Freier Autor
·Lesedauer: 5 Min.

Es ist eine jahrzehntealte Frage der Biologie: Wie entsteht die dreidimensionale Struktur eines Proteins? Jetzt könnte eine Künstliche Intelligenz der Google-Tochter Deepmind einen entscheidenden Hinweis zur Beantwortung beigetragen haben.

Das Enzym Katalase. In Zukunft könnte, dank einer KI-Anwendung der Google-Tochter Deepmind, die dreidimensionale Form des Proteins allein aus seiner Gensequenz vorhergesagt werden. Foto: Symbolbild / gettyimages / Leonid Andronov
Das Enzym Katalase. In Zukunft könnte, dank einer KI-Anwendung der Google-Tochter Deepmind, die dreidimensionale Form des Proteins allein aus seiner Gensequenz vorhergesagt werden. (Symbolbild: Getty Images Leonid Andronov)

Proteine, also Eiweiße, sind die Universalwerkzeuge der Zellen. Sie erledigen praktisch alle Funktionen im Körper. Dabei ist jedes Protein – bekannt sind hunderte Millionen – für genau eine Aufgabe verantwortlich. Um diese Aufgabe zu lösen, muss es eine bestimmte Form annehmen. Hinter diese Form, die sogenannte Proteinfaltung, versuchen seit mehr als 50 Jahren Wissenschaftler*innen zu kommen.

Nach welchen Regeln bildet sich die Form aus?

Die bisherigen experimentellen Verfahren, um die Form eines Proteins herauszufinden, sind dabei sehr teuer und zeitaufwändig. Es kann Jahre dauern, bis man durch Versuche mit Röntgengeräten, Elektronen-Tomographien oder Kernresonanzspektroskopien eine Protein-Struktur verstanden hat.

Interviewpodcast: Richard Socher, was denken Maschinen?

Es ist deshalb der heilige Gral der Biologie, anhand des genetischen Bauplans eines Proteins sein späteres Aussehen vorherzusagen. Denn in dem genetischen Bauplan steht nur die Abfolge seiner Bausteine: eine lange Kette von Aminosäuren. Bei der Protein-Herstellung werden diese Aminosäuren aneinandergereiht. Sie nehmen dann – wie von selbst – eine räumliche Struktur ein. Welchen Regeln diese Struktur dabei folgt, das war bis vor kurzem noch weitgehend unbekannt.

Keine jahrelangen Experimente mehr nötig

Jetzt könnte die britische Firma Deepmind, eine Google-Tochter, diesem Rätsel auf die Spur gekommen sein. Wie unter anderem das Science Media Center (SMC) vermeldet, hat Deepmind dazu das KI-Programm Alphafold benutzt.

Dabei handelt es sich um ein “Deep Neural Network” – einen selbstlernenden Algorithmus, der mit den Daten von bereits bekannten Protein-Strukturen trainiert wurde. Daraus hat Alphafold eigenständig Regeln abgeleitet, wie sich Proteine falten. Diese Regeln kann Alphafold nun nutzen, um eine Proteinstruktur nur anhand der Aminosäuren-Sequenz vorherzusagen. Selbst wenn Alphafold zuvor nie Informationen zu dem Protein erhalten hat. Dadurch wären in Zukunft keine aufwendigen Experimente oder Berechnungen mit Supercomputern mehr nötig, um die Struktur eines Proteins vorherzusagen.

So gute Ergebnisse wie die besten Experimente

Wie gut Alphafold ist, hat kürzlich ein internationaler Wettbewerb gezeigt. Dort bestand die Aufgabe darin, 100 Proteinstrukturen mit der Aminosäuren-Sequenz präzise vorherzusagen. Wie DeepMind in einem Blogeintrag meldet, hätten die Ergebnisse gezeigt, dass das Faltungsproteinen “largely solved” sei – so gut wie gelöst.

Alphafold kann bislang aber nur die Form einfacher Proteine vorsagen und nicht komplexe Strukturen, wie sie ebenfalls in der Natur vorkommen. Dennoch: In dem Wettbewerb konnte Alphafold 70 der zu lösenden 100 Proteinformen anhand ihrer Sequenzen so genau vorhersagen, wie man es bislang nur in Experimenten vermochte.

Corona-Impfstoffentwicklung: Der Erste seiner Art

Die Vorhersage-Genauigkeit wird dabei in einem Wert gemessen, dem sogenannten “Global Distance Test”. Die Skala dazu reicht von eins bis 100. Dabei erreichte Alphafold über alle Proteinstrukturen – von einfach bis komplex – einen Wert von 92,4. Die beste konkurrierende Forschungs-Gruppe erreichte 75. Ein Wert über 90 gilt als ähnlich gut, wie es die aufwendigen Experimente erreichen.

Noch hat DeepMind die Ergebnisse nicht veröffentlicht, aber ein Methodenpapier zu der neuen KI-Anwendung ist angekündigt. Das soll zeitnah von unabhängigen Forschenden untersucht und bewertet werden.

Problem gelöst? Übertrieben!

Um eine erste Einschätzung zu den Ergebnissen hat das SMC am Dienstag auch einige Expert*innen gebeten. Helmut Grubmüller, Direktor der Abteilung für theoretische und computergestützte Biophysik am “Max-Planck-Institut für biophysikalische Chemie” in Göttingen, sagt:

“Erst in den vergangenen Jahren sind wir der Lösung dieses ‚Proteinfaltungsproblems‘ einige Schritte nähergekommen.” Seither könne die Struktur kleiner, schnell faltender Proteine relativ zuverlässig von Computersimulationen aufgrund physikalischer Gesetze vorhergesagt werden. Das AlphaFold-Team sei jedoch einen anderen Weg gegangen.

“Mithilfe von maschinellem Lernen ist es ihnen gelungen, die ‚Regeln der Proteinfaltung‘ so gut aus einer großen Zahl bekannter Proteinstrukturen zu extrahieren, dass sie damit in einem Blindversuch-Wettbewerb 70 von 100 Proteinstrukturen sehr genau vorhersagen konnten. Dies ist zweifelsohne eine beachtliche Leistung und ein deutlicher Fortschritt, der viele andere Ansätze in den Schatten stellt. Ist damit aber das Proteinfaltungsproblem ‚weitgehend gelöst‘, wie die Autoren der Studie schreiben? Ich denke, das wäre etwas übertrieben.”

Fortschritt für die personalisierte Medizin

Zu den “Auswirkungen auf Praxis und Forschung” der Deepmind-Ergebnisse sagt Gunnar Schröder, er leitet die Forschungsgruppe “Computational Structural Biology” am Forschungszentrum Jülich:

“Proteinstrukturen sind direkt für die Entwicklung von Medikamenten wichtig. Proteine sind häufig das Ziel von Wirkstoffen, mit denen die Proteine zum Beispiel inhibiert werden sollen. Wenn wir ein genaues atomares Modell eines Zielproteins haben, kann dieses benutzt werden, um gezielt einen Wirkstoff zu entwickeln. Wir gehen davon aus, dass in Zukunft jeder Mensch sein Erbgut entschlüsselt haben wird. Da sich das Erbgut der Menschen unterscheidet, unterscheiden sich auch seine Proteine. Jeder Mensch hat also leicht unterschiedliche Proteine. Wir werden aber nicht in der Lage sein, für jeden Menschen seine eigenen Proteinstrukturen experimentell zu bestimmen. Mit Hilfe von Strukturvorhersagemethoden – wie zum Beispiel Alphafold – geht das nun aber.”

VIDEO: Künstliche Intelligenz soll COVID-19 an der Stimme erkennen