Google MUM (Multitask Unified Model)

Was ist Google MUM? Einfach erklärt!

Google Multitask Unified Model (MUM) ist eine recht neue Technologie, die es Google ermöglicht, hochkomplexe Fragen zu beantworten, die keine direkten Antworten haben. MUM kann verschiedene Arten von Informationen wie Texte, Audiodateien, Bilder und Videos in verschiedenen Sprachen verarbeiten und verstehen.

Mit MUM kann Google auch Zusammenhänge zwischen verschiedenen Themen herstellen und so bessere Suchergebnisse liefern. Diese Technologie ist ein wichtiger Meilenstein für KI und wird stetig dazu beitragen, dass wir noch schneller und genauer Antworten auf unsere Fragen erhalten.

Google hatte laut eigener Aussage festgestellt, dass oft sehr viele einzelne Suchanfragen nötig sind, bis die Suchmaschine das gewünschte Ergebnis liefert. MUM generiert verständliche Antworten, mit weniger einzelnen Fragestellungen. Das verändert natürlich den Umgang mit gewohnten Suchanfragen.

Wann wurde Google MUM vorgestellt?

Google hat MUM auf der Entwicklerkonferenz Google I/O vorgestellt. Die Google I/O 2021 fand vom 18. bis zum 20. Mai statt. Wegen der Corona-Pandemie wurde sie in dem Jahr online abgehalten, zum ersten Mal konnten sich alle möglichen Nutzer kostenlos dafür registrieren. Auf der Konferenz wurden viele neue Technologien und Produkte vorgestellt und Neuerungen angekündigt, darunter Android 12, Google Workspace und Google Maps Updates und eben auch die Künstliche Intelligenz Technologie MUM für die multimodale Suche. Die Konferenz bot Entwicklern und Interessierten eine Plattform, um sich über neueste Trends und Innovationen auszutauschen.

Was ist der Unterschied zwischen MUM und BERT?

Dass MUM wirklich nichts mit Müttern zu tun hat, haben wir ja jetzt geklärt. Aber wie unterscheidet es sich von seinem Vorgänger, dem Bidirectional Encoder Representations from Transformers (BERT)? Den beiden gemein sind ja ihre einprägsamen Namen.

Zunächst einmal ist MUM viel leistungsfähiger als BERT. Es kann bis zu 1.000-mal mehr Daten verarbeiten und versteht nicht nur Text, sondern auch Bilder und Videos, damit ist die Auswahl an möglichen Informationsquellen viel größer. Das bedeutet, dass es in der Lage ist, komplexe Aufgaben wie die Beantwortung von Fragen oder die Durchführung von Suchanfragen viel besser zu bewältigen.

Ein weiterer wichtiger Unterschied zwischen den beiden Technologien ist ihre Fähigkeit zum Multitasking. Während BERT nur eine Aufgabe gleichzeitig ausführen kann, kann MUM mehrere Aufgaben gleichzeitig bearbeiten. Das macht es besonders nützlich für fortschrittliche Anwendungen wie Chatbots oder virtuelle Assistenten.

Insgesamt bietet MUM eine erhebliche Verbesserung gegenüber BERT und wird voraussichtlich in Zukunft eine wichtige Rolle bei der Entwicklung von anderen KI-gesteuerten Anwendungen spielen.

Was sollte sich damit ändern?

MUM sollte es ermöglichen, dass man noch bessere Antworten auf komplexe Fragen bekommt, die nicht einfach mit einer einzigen Antwort abgetan werden können. Dabei kann MUM Zusammenhänge zwischen verschiedenen Themen herstellen.

Mehrsprachige Anwendungen

Im Gegensatz zu früheren Modellen wie BERT, die nur für eine bestimmte Sprache trainiert wurden, wurde MUM direkt mit Daten aus vielen verschiedenen Sprachen trainiert.

Konkret bedeutet das, dass während des Trainingsprozesses von MUM viele verschiedene Sprachen gleichzeitig (Google spricht von 75 verschiedenen) verwendet wurden. Dadurch konnte das Modell ein besseres Verständnis dafür entwickeln, wie verschiedene Sprachen miteinander zusammenhängen und welche Ähnlichkeiten es zwischen ihnen gibt.

Das bringt einige Vorteile mit sich. Zum einen kann MUM dadurch besser verstehen, was der Benutzer sucht und welche Ergebnisse am relevantesten sind – unabhängig davon, in welcher Sprache die Suchanfrage gestellt wird. Darüber hinaus kann es auch bei der Übersetzung helfen und so beispielsweise dabei unterstützen, Inhalte aus einer anderen Sprache zu verstehen.

Dank seiner mehrsprachigen Trainingsmethode kann MUM also nicht nur besser verstehen, was wir suchen oder sagen wollen – sondern auch in vielen verschiedenen Sprachen darauf antworten. Das macht es zu einem äußerst leistungsfähigen Tool für die automatische Textverarbeitung.

Konkrete Beispiele für den Nutzen von MUM

Es gibt viele verschiedene Anwendungsbeispiele für die Nutzung der künstlichen Intelligenz.

Suche in Bildern und in Videos

Google Lens ist eine App, die Bilder und Videos analysiert und Informationen darüber bereitstellt. Es kann Texte erkennen, Objekte identifizieren und sogar Pflanzen und Tiere bestimmen.

Mit Google Lens können Nutzer auch Übersetzungen vornehmen oder Produkte online finden. Die Anwendung ist in Google Assistant sowie in einigen Android-Handys integriert. Und auch hier sollte MUM die Möglichkeiten deutlich erweitern.

Google Lens und die Sockenfrage

Auf der Entwicklerkonferenz wurde beispielsweise eine sehr aufwändige Fragestellung via Google Lens beantwortet. Die Kamera wurde auf ein gemustertes Hemd gerichtet, und der Suchende wollte gerne passende Socken dazu haben. Daraufhin suchte MUM tatsächlich passende Shopping-Ergebnisse heraus. Diese Bild-basierte Suche erfordert dann ein hohes Maß an Verknüpfungen in den Datenquellen der Suchmaschine!

Reparaturanweisung

Ein weiteres Beispiel war die Suche nach einer Reparaturanleitung für ein defektes Fahrradteil. Ein aufgenommenes Foto der defekten Stelle wurde mit der Fragestellung „Wie kann ich das reparieren“ versehen. Google MUM kann dann beispielsweise passendes Werkzeug vorschlagen oder in YouTube Videos erkennen, ab welcher Minute solch ein Teil repariert wird.

Komplexe Fragen für Bergsteiger

Eindrucksvoll demonstriert wurde der Vorteil gegenüber BERT auf der Entwicklungskonferenz an einer Fragestellung, die nur über das Multitasking gelöst werden kann. BERT könnte die Frage „Wie hoch ist der Mt. Fuji“ oder „Wo kann ich Wanderausrüstung kaufen“ noch problemlos beantworten, die Frage „I’ve hiked Mt. Adams and now want to hike Mt. Fuji next fall, what should I do differently to prepare.“ (zu Deutsch: „Ich habe den Mt. Adams bestiegen und möchte im nächsten Herbst den Mt. Fuji besteigen, welche Veränderungen in der Vorbereitung muss ich beachten?“) hat aber ein ganz anderes Level an Komplexität

Hier beachtete Google MUM beispielsweise die Jahreszeit (Herbst) und passt basierend darauf dann die Kleidung an das erwartete Wetter für die Region an. Auch die Analyse (Data-Mining) in Bildern ist hier sehr hilfreich, da MUM erkennen können sollte, ob die abgebildeten Schuhe für eine Bergwanderung geeignet sind. BERT hätte nur die einzelnen Schlagwörter mit dem Index abgleichen können, ohne die Suchintention wirklich zu verstehen.

Was bedeutet das für die Suchmaschinenoptimierung (SEO)?

MUM hat das Potenzial, die Informationsverarbeitung von Google auf ein neues Niveau zu bringen. Im Gegensatz zu BERT, der sich auf die Bedeutung von Wörtern konzentriert, ist MUM eben multimodal.

Für Suchmaschinenoptimierung (SEO) bedeutet dies eine Veränderung in der Art und Weise, wie Websites optimiert werden müssen. Da MUM in der Lage ist, komplexe Fragen zu beantworten, die keine direkten Antworten haben, wird es wichtiger denn je, qualitativ hochwertigen Inhalt zu erstellen. Websites müssen sicherstellen, dass ihre Inhalte informativ und relevant sind und den Nutzern einen Mehrwert bieten.

Darüber hinaus wird auch die semantische Suche immer wichtiger. Das bedeutet, dass Websites sicherstellen müssen, dass ihre Inhalte nicht nur auf bestimmte Keywords optimiert sind, sondern auch relevante Begriffe enthalten, die mit dem Thema zusammenhängen.

Insgesamt soll MUM dazu beitragen, dass Suchanfragen noch besser verstanden werden können und Nutzern bessere Ergebnisse geliefert werden können. Für SEO bedeutet dies jedoch auch eine Veränderung in der Art und Weise ihrer Arbeit.

Google Multitask Unified Model soll eben nicht mehr nur die Texte auf deiner Webseite durchsuchen, und stattdessen auch Medieninhalte analysieren können. Der Schwerpunkt sollte dann nicht mehr nur auf Keywords liegen, sondern muss mehrdimensional gedacht werden.

Diese Entwicklung bedeutete aber auch, dass mehr Mitbewerber vorhanden sind. Schließlich musste sich dann, auf einen Schlag, der eigene Content mit multimodalen Inhalten messen lassen müssen – die Konkurrenz um Aufmerksamkeit und Relevanz steigt also.

Zusätzlich sollte MUM auch zunehmend dialogartig die Anfragen von Suchenden beantworten. Außerdem wurden die Featured Snippets ausgebaut, um mehr Fragen direkt auf der SERP zu beantworten.

SERP steht für „Search Engine Results Page“ (Suchergebnisseite). Wenn du eine Suchanfrage in Google eingibst, wird eine Liste von Webseiten angezeigt, die als Ergebnis deiner Suche erscheinen. Diese Ergebnisse werden auf der SERP dargestellt.

Die SERP enthält normalerweise organische Ergebnisse, die durch den Algorithmus der Suchmaschine basierend auf Relevanz und Autorität ausgewählt wurden. Es können aber auch bezahlte Anzeigen oder andere Arten von Inhalten wie Featured Snippets, Bilder oder Videos in den SERPs erscheinen.

Für SEO ist es wichtig, auf der ersten Seite der SERP zu erscheinen, da Nutzer in der Regel nur die ersten paar Ergebnisse überprüfen und selten zur zweiten oder späteren Seite gehen. Es gibt verschiedene Techniken und Strategien, um das Ranking einer Webseite auf den SERPs zu verbessern und somit mehr Traffic auf die eigene Website zu generieren.

Mit MUM ist es dann wichtig, die Inhalte so zu gestalten, dass die User die Featured Snippets auch wirklich anklicken und auf die eigene Seite gelangen, um mehr Informationen zu erhalten. Oft reichten die kurzen Informationsschnipsel dort nämlich nicht aus, um die Fragestellung komplett zu beantworten.