Er ist witzig, charmant und schnell: Open AIs neuer KI-Sprachassistent wirkt wie aus Hollywood

Mit einem neuen Sprachassistenten will es Open AI den Nutzern erleichtern, KI immer und überall zu nutzen. Zudem stellt die Firma eine neue Gratis-Version des mächtigen Sprachmodells GPT-4 vor. Das ist eine direkte Kampfansage an Apple und Google.

Marie-Astrid Langer, San Francisco 3 min
Drucken
Neuerdings kombiniert Open AI KI-Antworten aus Bild, Text und Audio.

Neuerdings kombiniert Open AI KI-Antworten aus Bild, Text und Audio.

Jaap Arriens / NurPhoto / Getty

Wer nach Hinweisen dafür sucht, dass in den USA ein Machtkampf um die Führerschaft in künstlicher Intelligenz tobt, der muss diese Woche ins Silicon Valley schauen. Genau 24 Stunden, bevor Google ab Dienstag an seiner Entwicklerkonferenz Durchbrüche bei künstlicher Intelligenz demonstrieren will, sorgte Open AI am Montag für Aufsehen. Die Firma hinter dem Chatbot GPT stellt ihr bis dato leistungsstärkstes Sprachmodell GPT-4 nun in einer neuen Version namens GPT-4o allen Nutzern gratis zur Verfügung – ein Paukenschlag.

Der Buchstabe «o» in der Bezeichnung des Modells steht für das lateinische Wort «omni» (alle). Das teilte die Cheftechnologin Mira Murati bei einer live übertragenen Präsentation am Firmensitz in San Francisco mit. Die mehr als 100 Millionen Nutzer, die den Chatbot Chat-GPT bereits nutzten, könnten nun auf ein markant schnelleres und klügeres Modell zugreifen. Das neue Modell kann gemäss Open AI in seinen Ergebnissen auch Audio, Text und Bild kombinieren.

Youtube/Open AI

«Ein wichtiger Teil unserer Mission ist es, jedermann fortschrittliche KI-Werkzeuge gratis zur Verfügung zu stellen», schrieb später der CEO Sam Altman auf seinem Blog. «Wir sind eine Firma, und wir werden immer Dinge finden, für die wir Geld verlangen, und das wird uns dabei helfen, herausragende KI (hoffentlich) Milliarden von Menschen gratis zur Verfügung zu stellen.»

Der Hollywood-Film «Her» inspirierte Altman

Zudem stellte Open AI seinen neuen Sprachassistenten vor – und dieser funktioniert verblüffend gut. Wer bisher Konversationen mit anderen Assistenten wie «Alexa», «Siri» oder «Google» frustrierend fand, weil diese einen schlichtweg nicht verstehen, dürfte angenehm überrascht werden.

Open AIs Assistent klingt tatsächlich wie ein Mensch, man kann ihn unterbrechen, und er antwortet ohne Verzögerung. Ausgelöst wird er durch den Zuruf «Hey Chat-GPT». Der Assistent ist locker in der Sprache, bisweilen sogar witzig, und gibt sich emotional. Im Gegensatz zu früheren Spracherkennungsfunktionen von Open AI kann der neue Sprachassistent dank GPT-4o auch einzelne Sprecher unterscheiden und Hintergrundgeräusche ausblenden.

Gemäss Open AI kann der neue Assistent die Gefühle des Nutzers in der Stimme und im Gesichtsausdruck erkennen und entsprechend darauf reagieren. Erinnerungen werden wach an den Hollywood-Film «Her» aus dem Jahr 2013, bei dem sich der Hauptdarsteller in einen künstlich intelligenten Sprachassistenten verliebt. In einer Rede hatte Altman vergangenes Jahr erzählt, dass er von dem Film inspiriert worden sei. «Es fühlt sich an wie KI aus einem Film», schrieb der CEO am Montag auf seinem Blog mit Blick auf den Sprachassistenten. «Ich finde es immer noch überraschend, dass das nun Realität ist.»

In den sozialen Netzwerken zeigte Open AI am Montagnachmittag in zahlreichen Videos, wie insbesondere der Sprachassistent das Leben von Nutzern künftig prägen könnte, beispielsweise von Menschen mit Sehbehinderung oder als Nachhilfelehrer von Schülern.

X/Open AI

Auch kann der Sprachassistent nun zwischen Personen dolmetschen; Murati führte dies auf Italienisch und Englisch vor. Für welche Sprachen dies möglich sein wird, teilte Open AI bisher nicht mit. Für Interessenten ohne Abo sollen die neuen Funktionen «in den nächsten Wochen» zur Verfügung gestellt werden. Für Plus-Nutzer war Chat-GPT 4o in den USA bereits am Montagnachmittag nutzbar.

Google und Apple stehen nun unter Zugzwang

«Mit einem Computer zu reden, hat sich für mich nie natürlich angefühlt», schrieb Altman nach der Produktpräsentation auf seinem privaten Blog. «Jetzt tut es das.» Er gab auch einen Vorgeschmack auf das, woran man bei Open AI zurzeit offenbar tüftelt: «Wir arbeiten an Personalisierung, Zugriff auf Ihre Informationen, die Möglichkeit, für Sie Aufgaben auszuführen, und mehr – ich sehe eine aufregende Zukunft vor uns, in der Computer mehr für uns tun werden als je zuvor.»

Klar ist, dass Open AI mit den Produktvorstellungen die Messlatte für die etablierten Technologiekonzerne enorm hochlegt. Insbesondere Google und Apple stehen nun unter Zugzwang, bei ihren jeweiligen Entwicklerkonferenzen am 14. Mai und am 10. Juni die KI-Funktionen von Open AI zu übertrumpfen.

Die Schlüsselfrage ist, wie sich die grossen Konzerne noch differenzieren wollen – oder ob sie einen anderen Ansatz wählen. Wie «Bloomberg» jüngst berichtete, plant Apple eine Zusammenarbeit mit Open AI. Angeblich soll die nächste Version des Betriebssystems für das iPhone Funktionen von Chat-GPT beinhalten.

Mehr von Marie-Astrid Langer (lma)

Mehr von Marie-Astrid Langer (lma)

Weitere Artikel
Weitere Themen