Nexus 220: GPT-4o Mini & die Kostenimplosion, Big Tech hält EU Produkte vor, Chinesische Robotaxis, Netflix-Wachstum

Hi,

ein Programmhinweis: Nächste Woche erscheinen noch einmal regulär 2 Briefings. Eine öffentlich Dienstag/Mittwoch, eine für Mitglieder am Freitag. Die Woche darauf gibt es kein Briefing. Im August werden mindestens die erste Hälfte des Monats nur Mitgliederbriefings erscheinen. Also nur ein Briefing pro Woche und zwar Freitags.

Und noch ein Programmhinweis: Ich sage nichts zu den politischen Bekenntnissen unter US-VCs in dieser Ausgabe, weil ich mir das für die letzte öffentliche Ausgabe vor der Pause nächste Woche aufhebe.

Marcel

Im Fokus dieser Ausgabe:

GPT-4o Mini passt in den aktuellen Trend: LLMs werden effizienter und schneller und günstiger bei ungefähr gleichbleibender Outputqualität. Das hat mehr unmittelbare Auswirkungen als teure, bessere Modelle, die wohl kommen werden. Namentlich wird generative KI noch schneller überall als Feature aufschlagen.
EU: Meta wird neue multimodale Modelle wegen DSGVO nicht in die EU bringen, Apple wird Apple Intelligence wegen DMA zurückhalten. Genau was Brüssel wollte, oder?
Meta will bei seiner VR-Hardware sparen, gibt aber selbst nach Einsparungen immer noch sehr viel Geld für die Entwicklung aus.
China pusht Robotaxis.
Netflix wächst dank Werbeplänen.
und mehr

Zitat des Tages

So obvious. How did I not ever think of this?
Batteries will be everywhere.

Ein User auf X

🤖 KI

GPT-4o Mini: Die Kostenimplosion geht weiter

GPT-4o Mini, das neue Modell von OpenAI, folgt dem allgemeinen Trend, denn wir von GPT-4o und den jüngsten Modellen von Anthropic bereits kennen: Schneller und vor allem günstiger bei nahezu gleichbleibenden Ergebnissen.

Simon Willison:

It supports 128,000 input tokens (both images and text) and an impressive 16,000 output tokens. Most other models are still 4,000, and Claude 3.5 Sonnet got an upgrade to 8,000 just a few days ago. This makes it a good fit for translation and transformation tasks where the expected output more closely matches the size of the input.
GPT-4o mini is 15 cents per millions input tokens and 60 cents per million output tokens - a 60% discount on GPT-3.5, and cheaper than Claude 3 Haiku's 25c/125c and Gemini 1.5 Flash's 35c/70c. Or you can use the OpenAI batch API for 50% off again, in exchange for up-to-24-hours of delay in getting the results.
OpenAI point out that "the cost per token of GPT-4o mini has dropped by 99% since text-davinci-003, a less capable model introduced in 2022."

Das verschiebt weiter, was effektiv mit diesen Modellen im Alltag gemacht werden kann.

Diese Entwicklung ist sogar, frankly, für Hier und Jetzt weitaus folgenreicher als möglicherweise kommende teurere Modelle, die mehr leisten können.

Hier ein Beispiel von X für den Kontext:

Lesen Sie die ganze Geschichte

Melden Sie sich jetzt an, um die vollständige Geschichte zu lesen und Zugriff auf alle bezahlten Beiträge zu erhalten.

Haben Sie bereits ein Konto? Einloggen

Nexus 220: GPT-4o Mini & die Kostenimplosion, Big Tech hält EU Produkte vor, Chinesische Robotaxis, Netflix-Wachstum

Zitat des Tages

🤖 KI

GPT-4o Mini: Die Kostenimplosion geht weiter

Lesen Sie die ganze Geschichte

Briefing 282: Mit dem Rücken zur Wand

Briefing 281: Profitabel, exklusiv, uneinholbar?

Briefing 278: KI und die Zukunft der Arbeit und der Software