Hi,
wellwellwell, eigentlich hatte ich andere Themen für heute geplant.
Marcel
Im Fokus dieser Ausgabe:
- OpenAIs neues Modell GPT-4o ist schneller, günstiger und besser als GPT-4 Turbo.
- Kein GPT-5: GPT-4o ist kein großer Sprung wie von GPT-3.5 auf GPT-4, aber dennoch ein Gamechanger.
- Verfügbarkeit: GPT-4o wird in ChatGPT auch kostenfrei verfügbar sein.
- Mainstream: GPT-4o ist für den Mainstream konzipiert und wird globalen Impact haben.
- und mehr
Zitat des Tages
If you had said 2 years ago that we’re regularly going to have the cost of human level intelligence drop by 50% and get 2X faster for any developer on earth to access, it would simply not have been believable. This is the most amazing time to be in tech.
Box-CEO Aaron Levie auf X
OpenAIs neues Modell: GPT-4o, was es ist, was es nicht ist
Am Tag vor Googles I/O-Konferenz ein neues Modell vorzustellen, das alles schlägt, was Google vorstellen kann. Da sind Microsofts Milliarden doch gut angelegt.
Das Wichtigste über GPT-4o
"Besser, schneller oder günstiger - wähle zwei." Das Erstaunliche an OpenAIs neuem Modell GPT-4o ist, dass es mehr oder weniger alle drei Achsen erfüllt.
- GPT-4o ist günstiger. OpenAI spricht von 50% Preisreduktion.
- GPT-4o ist schneller, sehr viel schneller.
- GPT-4o ist an vielen Stellen besser als GPT-4 Turbo.
- GPT-4o ist vollständig multimodal. Das Modell wurde gleichzeitig auf Text, Audio und Video trainiert, was bedeutet, dass es zwischen den einzelnen Medienarten interpolieren und springen kann.
OpenAI setzt die Tradition der schlechten Modellnahmen weiter fort. Das 'o' in
GPT-4o ist keine Null sondern ein 'o', das für 'omni' steht.
Kein GPT-5
GPT-4o ist kein großer Sprung in der Outputqualität wie seinerzeit von GPT-3.5 auf GPT-4 (Christ, diese Namen). Es ist "nur" ein bisschen besser hier und da.
[convertkit form=6138897]
Der Name deutet es schon an; keine 5. Man sollte das aber deswegen nicht unterschätzen. 4 oder 5, das ist ein PR-Thema. Bei den hohen Erwartungen wird es vielleicht nie ein GPT-5 geben und stattdessen neue (unmöglich dämliche) Modellnamen.
GPT-4o ist dennoch der erste große Gamechanger von OpenAI seit GPT-4.
Gamechanger Preis
Als damals, die Älteren erinnern sich, im März diesen Jahres, Claude 3 von Anthropic erschien, waren viele von der Qualität begeistert. Ich war eher zurückhaltend, weil Claude 3 Opus, das beste Modell der Familie, schlicht für vieles zu teuer war und ist. Aus Nexus 189:
- Anthropic hat es nur auf GPT-4-Level bei der Output-Qualität geschafft. Die hohen Tokenpreise müssen an hohen Inferenzkosten liegen. Was wiederum bedeutet, dass Opus im Alltag schlicht zu ineffizient arbeitet und für viele Anwendungsfälle nicht als Alternative zu GPT-4 in Frage kommt.
GPT-4o kostet ein Fünftel (!) von Claude Opus, ist sehr viel schneller und besser.
Gamechanger weil: GPT-4o wird kostenlos bei ChatGPT verfügbar sein. Das bedeutet, dass Millionen von Menschen, die aktuell glauben zu wissen, was generative KI heute bedeutet, in den nächsten Tagen und Wochen von ihren Stühlen fallen werden.
Der riesige, gigantische Unterschied zwischen dem alten GTP-3.5 und den aktuellen Modellen ist nicht bekannt in der Öffentlichkeit, warum auch. Das führt seit über einem Jahr zu Missverständnissen, zu was diese Technologie fähig ist.
Die nutzungsbeschränkte, kostenfreie Verfügbarkeit von GPT-4o wird wie ein Katalysator auf das Thema wirken. (Das wird auch gute Werbung für OpenAIs Enterprise-Angebot sein.)
Desweiteren bedeutet das, dass sich mittelfristig die Preisgestaltung im KI-Sektor ändern wird. KI-Produkte werden günstiger und erschwinglicher werden. Wichtiger als der B2C-Bereich aber: Für Enterprise-Produkte wird die Kosten/Nutzenanalyse noch besser. (Was gemessen am Wert gar nicht nötig gewesen wäre.)
Hier ein Preisvergleich, was die verbreitesten Modelle auf den Hyperscalern kosten:
Siehe auch Simon Willison zu Preisgestaltung und mehr.
Gamechanger Multimodalität
GPT-4o kann Text, Video und Audio gleichzeitig verarbeiten, wie wir es bisher von keinem Modell auf diesem Level gesehen haben.
Multimodalität dürfte ein Hauptgrund für die kommende Mac-App sein. Lokale Apps, die per Screensharing auf die Monitorausgabe zugreifen können, sind ein naheliegendes Vehikel für multimodale KI-Assistenten, die der Nutzer:in helfen.
Noch naheliegender ist die Integration ins Betriebssystem. Etwas woran Apple und Google arbeiten (mein Text bei der FAZ) und Microsoft für Windows bereits angekündigt hat und mit GPT-4o jetzt auch parat hat.
Diverse Beispiele des Einsatzes von OpenAI auf X:
- Simultanübersetzung
- Lernhilfe für Schüler:innen
- Multimodale Interaktion (und mehr)
- Assistenz beim Programmieren
KI-Modelle wie dieses können unzählige Apps ersetzen.
Die Multimodalität des neuen Modells ist technisch nicht gerade trivial. Sie haben es unter anderem geschafft, Videos in Echtzeit an einen Transformer zu streamen. Da muss innovative Vorarbeit lokal stattfinden. (Für erste Gedanken dazu siehe NVIDIA-Forscher Jim Fan auf LinkedIn.
Geschwindigkeit
Für Videoauswertung, aber auch für die neue Sprachinteraktion, die geringe Latenz hat, ist Geschwindigkeit entscheidend.
Das meinte ich oben, warum ich bei Claude Opus wenig beeindruckt war. Die Langsamkeit und der Preis halten nicht nur Implementationen in Unternehmen ab, die Langsamkeit verhindert auch grundsätzliche Einsatzmöglichkeiten für LLMs.
Dank eines neuen Tokenizers, der unter anderem für die Geschwindigkeitsverbesserung verantwortlich ist, werden manche Sprachen laut OpenAI wie Koreanisch nicht nur doppelt so schnell sondern bis zu 3,4 Mal schneller.
Wann was verfügbar sein wird
GPT-4o’s text and image capabilities are starting to roll out today in ChatGPT. We are making GPT-4o available in the free tier, and to Plus users with up to 5x higher message limits. We'll roll out a new version of Voice Mode with GPT-4o in alpha within ChatGPT Plus in the coming weeks.
Developers can also now access GPT-4o in the API as a text and vision model. GPT-4o is 2x faster, half the price, and has 5x higher rate limits compared to GPT-4 Turbo. We plan to launch support for GPT-4o's new audio and video capabilities to a small group of trusted partners in the API in the coming weeks.
GPT-4o ist bereits bei Perplexity und Co. verfügbar.
KI für die Massen
Statt nur auf die Outputqualität zu schauen, hat sich OpenAI auch die anderen Achsen angeschaut.
GPT-4o lässt sich am besten so zusammenfassen: GPT-4 für den Mainstream. Es ist günstig genug, um mit Einschränkung kostenfrei angeboten zu werden.
Die haarsträubend übertriebene Anthropomorphisierung der Sprachausgabe ist ebenfalls auf den Mainstream ausgerichtet.
Man muss im Auge behalten: Das am schnellsten wachsende KI-Startup, das nicht OpenAI heißt, ist Character.AI.
OpenAI hat eine enorme Kurskorrektur vorgenommen. Sie wollen mainstreamiger werden.
Egal, wie man es bewertet -ich finde die Gefühlssimulation äußerst fragwürdig bei einem allgemeinen Assistenten-, es sollte klar sein, dass das Massenappeal hat.
Darüber hinaus sollte man den globalen Impact nicht unterschätzen.
Global entrepreneurship: GPT-4o will be available around the world. This is exciting because many innovative ideas never see the light of day because innovators have trouble figuring out how to get them to market. AI acts as an excellent co-founder, filling in some of the gaps that every founder has in their skillset. Everyone can now write in perfect English, can do basic coding, can get help with problems, and more. We already know that getting advice from GPT-4 increased the profitability of high performing small business entrepreneurs in Kenya by 15%. Free access to this powerful tool may have profound implications.
[convertkit form=6138897]
🇪🇺 eu/acc jetzt mit Website, Discord etc.
"by European founders, for European founders."
eu/acc hat jetzt eine Website, Discord etc.:
The goal of this project is to…
Highlight excellence – to shift the discussion from negative memes to our impressive realities
Showcase the actual problems – to unify the narrative of our requests to policymakers
Suggest few and simple solutions – to allow policy makers picking efforts with high leverage
eu/acc – by European founders, for European founders.
Europa braucht mehr solche Initiativen.
Siehe auch:
- European Accelerationism (Nexus 201)
- Dinge, welche die EU angehen sollte, Pt. 2 (Nexus 203)
🤖 KI
Wie Microsoft bei KI gewinnen will
**Alle großen Tech-Konzerne investieren aggressiv in KI. Microsoft aber sticht heraus. Der Konzern befindet sich seit über einem Jahr in einer beispiellosen Offensive. **
In meinem FAZ-Text dazu spreche ich darüber, wie Microsoft zunehmend auf mehrere Pferde im KI-Rennen setzt, sowohl bei Robotik als auch bei den LLMs, und warum sie beim Thema KI so aggressiv sind (hallo, Bill Gates).
Last not least gibt es im Text auch einen vielleicht unfair erscheinenden Vergleich mit dem, was in Deutschland und Europa gemacht wird und die Frage: Reicht das? Und wenn ja, wofür?
Es war 2019, als Microsoft-CTO Kevin Scott intern in einer E-Mail von einem beunruhigenden Rückstand im eigenen Unternehmen beim Thema KI schrieb. Werden solche E-Mails heute in deutschen, in europäischen Unternehmen auf Entscheiderebene ausgetauscht?
-> Wie Microsoft mit aller Macht bei KI „gewinnen“ will
📱💸 Big Tech
Verbraucherzentrale NRW klagt gegen Meta wegen »Pay-or-Consent«-Modell
Meta lässt die Nutzer:innen zwischen Abo (9,99-12,99€/Monat) für Werbefreiheit und personalisierter Werbung wählen.
Die Entscheidung zwischen »Zahlen oder Einwilligen« sei nicht freiwillig, erklärten die Kläger. Entweder schließen die Nutzerinnen und Nutzer der beiden Netzwerke ein Abo ab, was für beide Plattformen zusammen schnell über 250 Euro pro Jahr koste, oder sie willigten in die Datenverarbeitung für personalisierte Werbung ein.
Oder, and hear me out here, die Nutzer:innen, die beides nicht wollen, benutzen einfach nicht die Produkte von Meta.
Das eigentliche Problem der Verbraucherzentrale NRW ist die Popularität der Meta-Produkte.
⚖️ Regulierung
Booking.com fällt unter DMA
ZDF:
Booking muss demnach gerechtere Bedingungen für Anbieter von Hotels und Ferienwohnungen schaffen.
Wer über Booking eine Unterkunft für einen Urlaub bucht, soll künftig "mehr Auswahl und Freiheit" haben. Die Plattform müsse Anbietern zudem "einen fairen Zugang" zu ihren Diensten bieten, teilte die EU-Kommission weiter mit. Dabei dürfte es unter anderem um mehr Entscheidungsfreiheit bei den Buchungs- und Stornokonditionen gehen.
Im Gegensatz zu den großen Social Networks und Betriebsystemen ist Booking ein klassischer Matchmaker.
Dinge, die die EU von Booking einfordern wird, werden sich branchenunabhängig übersetzen lassen.
Something to watch.
[convertkit form=6138897]
✴️ Mehr Wissenswertes
USA legt Einfuhrzoll von 100% auf E-Autos. Noah Smith:
Joe Biden is about to slap 100% tariffs on Chinese-made electric vehicles. A 100% tariff is an absolutely huge tariff. It means that Chinese EV makers would have to sell their EVs in the U.S. at half the price of EVs manufactured elsewhere in order to be competitive. That just isn’t going to happen.
A 100% tariff will probably be enough to keep essentially all made-in-China EVs out of the U.S. The Rhodium Group recently came out with a report called “Ain’t No Duty High Enough”, arguing that Europe would need 40-50% tariffs to keep Chinese EVs out
Chinese EVs are very good. China has struggled to make good internal combustion engines, but the shift to EVs has allowed them to leapfrog ICE vehicles entirely. Since China dominates the battery industry, mastering EVs was easy. Kevin Williams has a long article about the high quality of Chinese electric cars, which you should read despite the fact that it contains a fair share of histrionic hand-wringing “We’re cooked”, etc.). Williams’ conclusion is spot on:If the U.S. and Europe get what they want—a crackdown on Chinese imports—it doesn’t feel like it would result in better cars. It feels like it would keep buyers of those markets locked to cars that aren’t executed as well. It’s nakedly protectionist because deep down, all of the Western auto executives and some hawkish China pundits understand that Chinese EV and PHEV models are more compelling than what European, other Asian, and American brands have come up with. Tariffs are applied based on where final assembly for a good takes place. So if BYD or other Chinese carmakers put their factories in America — or in Mexico, or Canada, or any place other than China — they will still be able to sell EVs to the U.S. without getting hit by Biden’s new tariff.
BYD hat Ähnliches in Europa vor. Aus Nexus 189:
BYD plant bereits eine Fabrik in Ungarn, und Experten erwarten, dass MG und andere chinesische Hersteller in Europa ähnliche Schritte unternehmen werden. Wir sehen ähnliches bereits im Onlinehandel bei den Übernahmen durch JD und Shein.
Deutsche nutzen ChatGPT für Kaufrecherche. OMR:
Bei einer vom Marktforschungsunternehmen Appinio für OMR durchgeführten repräsentativen Umfrage haben 33 Prozent der Befragten (zwischen 16 und 65 Jahren) erklärt, dass sie schon einmal ein KI-Tool wie ChatGPT zur Produktrecherche genutzt haben.
Knapp 60 Prozent der Befragten erklärten, mindestens schon einmal ein KI-Tool genutzt zu haben. Am häufigsten haben die Verbraucher*innen schon einmal Tools von OpenAI genutzt, also den KI-Chatbot ChatGPT oder das Bild-Generierungs-Tool Dall-E.
Wurde Zeit, dass die Casual User ein besseres Modell bekommen.
MG Siegler über GPT-4o-Reaktionen und den Film Her:
But sometimes, just sometimes, despite Hollywood's general attempts to paint the future as dystopian much of the time, sci-fi can actually inspire. Yes, even in glimpses of new technology taken out of some dystopian context.
Take Apple's Vision Pro, for example. The immersive 3D home video content is truly remarkable. And moving. And also remarkably similar to the videos in Minority Report. You know, the technology Tom Cruise's John Anderton is using to watch replays of his abducted son in happier times. DID APPLE LEARN NOTHING FROM MINORITY REPORT?!
Hopefully not. Because again, these are fictional narratives that perhaps you can learn something from on some thought-provoking level, but not on the real world x-is-going-to-lead-to-y level.