Gemini kann nicht nur in einem Chatbot Texte generieren, sondern auch bestimmte Probleme lösen und situationsabhängige Entscheidungen treffen. Es kann auch Informationen aus Fotos und Videos aufnehmen. Google demonstrierte das System mit einem Videochat, bei dem Gemini Zeichnungen und Handgesten des menschlichen Gegenübers sofort erkannte und richtig einordnete.
"Wir bringen Gemini über die Google-Produkte zu Milliarden von Menschen", kündigte der Chef von Google DeepMind, Demis Hassabis, an. Die Google-Tochter war im April 2023 aus dem 2014 zugekauften britischen Start-up DeepMind und der Google-internen KI-Abteilung hervorgegangen. Mit der Integration des bis zu diesem Zeitpunkt weitgehend unabhängig agierenden Start-ups wollte Pichai die KI-Anstrengungen im Google-Konzern bündeln, um entschiedener gegen OpenAI antreten zu können.
Google wird das neue System in drei unterschiedlichen Dimensionen einführen: Gemini Ultra, Gemini Pro und Gemini Nano. Gemini Ultra ist das größte und leistungsfähigste Modell für hochkomplexe Aufgaben. Diese Variante richtet sich vor allem an Unternehmenskunden.
Gemini Pro wird sich an ein breites Publikum wenden und beispielsweise dem Chatbot Google Bard "fortgeschrittenes Denken, Planen, Verstehen und mehr" beibringen. "Dies ist das größte Upgrade für Bard seit seiner Einführung", sagte Hassabis. Bard werde von sofort an in mehr als 170 Ländern und Gebieten auf Englisch verfügbar sein. Google plane aber, in naher Zukunft neue Sprachen und Standorte zu unterstützen.
Die dritte Gemini-Variante Nano bringt das System auf das Topmodell der Google-Smartphones Pixel. "Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft", kündigte Hassabis an. Damit lässt sich beispielsweise mit der Recorder App nicht nur gesprochene Sprache aus einem längeren Meeting, einer Vorlesung oder einem Interview aufzeichnen und in Echtzeit in schriftliche Sprache umwandeln. Mit Hilfe von Gemini Nano kann das Pixel dann außerdem ohne Zeitverzögerung eine kompakte Zusammenfassung erstellen. In den kommenden Monaten wird Gemini in weiteren Google-Produkten und Diensten wie Suche, Werbeanzeigen oder dem Chrome-Browser verfügbar sein.
Google arbeitet schon seit Jahren an Anwendungen auf Basis Künstlicher Intelligenz, steht aktuell aber unter Zugzwang, mehr davon preiszugeben. Vor einem Jahr löste das Start-up OpenAI einen neuen Wettstreit bei Künstlicher Intelligenz aus, als es seinen Chatbot ChatGPT öffentlich machte. Die Software sorgte für viel Aufsehen, weil sie Sätze wie ein Mensch bilden kann. Sie wird mit gewaltigen Datenmengen trainiert und schätzt Wort für Wort ab, wie ein Satz weitergehen könnte. Das bringt das Risiko mit sich, dass sie völlig falsche Informationen ausgeben kann.