Nexus 223: Flux.1, Oxolo und der AI Act, SAP Forecasting, Apple vs. Patreon, chinesische Robotaxis in den USA

Hi,

ich finde es bemerkenswert, dass Flux.1 und das Inkrafttreten des AI Acts (1.8.24) zeitlich so nah zusammenfallen.

Marcel

Im Fokus dieser Ausgabe:

Flux.1: Ein TextzuBild-Generator aus Deutschland auf höchstem Niveau, aber noch ohne Sicherheitsschranken.
Oxolo gibt den AI Act als Grund für die Schließung bekannt, das darf bezweifelt werden. Aber der AI Act hilft auch nirgends.
LLMs werden Commodities.
Perplexity Publisher Program ist der Anfang eines Werbemodells, das sich am YouTube-Modell orientiert.
SAP arbeitet an einem Forecasting-LLM.
Das erste chinesische Robotaxi-Startup darf in Kalifornien anfangen.
und mehr

🤖 KI

Black Forest Labs und die deutsche KI-Startuplandschaft

Das Start-up Black Forest Labs aus Freiburg hat mit seinem Bildgenerator FLUX.1 einen starken Einstieg in den KI-Markt hingelegt. Denn die Modellfamilie übertrifft in den Augen, derer die sich damit intensiv beschäftigen (wozu ich nicht gehöre), selbst führende Bildgeneratoren wie Midjourney und DALL-E 3.

Die Firma hat in der ersten Woche mehrere Millionen Nutzer verzeichnet und ist auf der Plattform Hugging Face auf Platz eins und zwei der Trendcharts.
Black Forest Labs hat eine Partnerschaft mit X und bietet seinen Bildgenerator für dortige Abonnent:innen an.
Das Start-up hat kürzlich 31 Mio. US-Dollar in einer Finanzierungsrunde gesammelt.
Ein Videomodell soll folgen.

Capital:

Das Start-up hat am 1. August seinen neuen Bildgenerator FLUX.1 herausgebracht, der nach Recherchen von Capital bereits in der ersten Woche mehrere Millionen Mal genutzt wurde.

Und über den Hintergrund:

In Branchenkreisen haben sich die Gründer Robin Rombach, Andreas Blattmann und Patrick Esser allerdings schon einen Namen gemacht. Alle drei haben zuvor an der Ludwig-Maximilians-Universität München unter dem renommierten KI-Professor Björn Ommer die Grundlagen der künstlichen Bildgenerierung erforscht.
Aus ihrer Arbeit ging unter anderem der Code für den Bildgenerator Stable Diffusion hervor, der 2022 in dem britischen Start-up Stability AI aufging. Rombach und Blattmann waren dort bis März 2024 als Wissenschaftler angestellt.
Für das weitere Wachstum hat das Start-up vor kurzem eine erste Finanzierungsrunde in Höhe von 31 Mio. US-Dollar abgeschlossen.

Zu den Investoren zählen unter anderem a16z, General Catalyst und das deutsche Mätch VC.

Eine Handvoll Anmerkungen:

Die Gründer haben Stability AI erst verlassen als es dort drunter und drüber ging.
Und haben dann quasi aus dem Stand ein sehr gutes Modell auf den Markt bringen können. Da mussten fachlich kompetente Menschen erst hartnäckig von äußeren Entwicklungen überzeugt werden.
Das Unternehmen sitzt zwar in Deutschland, ist aber in den USA in Delaware registriert. Es ist also auf dem Papier ein US-Unternehmen. Ich gehe davon aus, dass wir das künftig immer öfter sehen werden, weil es so einfacher ist ausländisches Geld zu gewinnen. Niemand in den USA etwa hat Lust und Zeit für jedes Investment ein paar Stunden bei einem deutschen Notar sitzen zu müssen.

Dieses von Null auf Hundert bei Black Forest Labs ist keine deutsche Erfolgsgeschichte; es ist vielmehr ein Signal dafür, dass wir hierzulande fachliches KI-Wissen auf höchstem internationalen Niveau haben, aber aus unterschiedlichsten Gründen kulturell/strukturell das nicht auf gleichem Niveau in Unternehmen übersetzen.

FLUX.1, Oxolo und der AI Act

Business Insider über die Einstellung des Oxolo-Angebots (KI-Inhalte für Marketing):

Unter der Überschrift „Termination of Oxolo“ steht außerdem: Man handle „aufgrund der Marktdynamik“ und einer „strategischen Neuausrichtung“ folgend. „Trotz unserer besten Bemühungen waren wir mit erheblichen Hindernissen konfrontiert, wenn es darum ging, einen Wettbewerbsvorteil aufrechtzuerhalten und mit den technologischen Fortschritten Schritt zu halten.“
Gründerszene hat bei Co-Cründerin und CCO Elisabeth L’Orange nachgefragt. Die Gründerin zeigte sich dabei frustriert von komplexen Regulierungen und Vorgaben, die es Unternehmern in Deutschland schwer machen, wie sie sagt. Von AI Act bis DSGVO – für Startups seien solche Hürden enorm.

Ich wäre vorsichtig damit, das dem AI Act in die Schuhe zu schieben: Von außen lässt sich das nicht eindeutig zuordnen, die Gründer nennen mehrere Gründe, wäre das Produkt ein Erfolg, würde man erst einmal abwarten und nach Auswegen suchen statt vorzeitig die Segel zu streichen. Aber:

Was die EU macht, hat natürlich nicht geholfen.

Kein Startup wird jemals sagen, es hat leider nicht geklappt mit unserem Angebot, trotz der Hilfe durch den AI Act.

Insgesamt ist aber das Timing interessant: Flux.1 hat keine der Sicherheitsvorkehrungen, die bei Dall-E 3 und Midjourney eingebaut sind, um Deep Fakes oder Trademark-Verletzungen zu verhindern. Das liegt sicher auch daran, dass das Team einfach erst mal das Modell gebaut hat.

Nichts in KI ist sicher, außer dem hier: Sie werden das zeitnah anpassen und/oder der AI Act wird sie vernichten.

Das vielleicht lustigste und gleichzeitig traurigste Szenario:

Die deutsche Presse ist begeistert von den Fähigkeiten von Flux.1, Flux.2 etc.
Der AI Act macht das Anbieten dieser Modelle in Europa unmöglich.
Black Forest Labs, das eh schon in Delaware registriert ist, verlegt seinen inoffiziellen Sitz dorthin wo sie offiziell als Unternehmen schon registriert sind: In die USA.
Yay, Wirtschaftsstandort!

Modelle werden Commodities

Was mir bei Flux.1 aufgefallen ist, dachte ich neulich schon bei Grok 2. Es gibt jetzt bereits 5 LLMs, die mehr oder weniger auf GPT-4-Level sind: GPT-4o, Claude 3.5, Gemini 1.5, Llama 3.1 und eben Grok 2.

Das ging schnell und wird weiter schnell gehen. Bei Flux.1 sehen wir eine ähnliche Reproduzierbarkeit der guten Modelle für Bildgenerierung.

Zumindest die Modelle für den generellen Einsatz werden austauschbare Commodities.

Da steckt schon drin, was uns erwartet: Spezialisierte Modelle könnten Differenzierung bringen. Auch wenn die besten LLMs aktuell noch spezialisierte Modelle oft schlagen. Mehr Differenzierung sogar wird auf der Produkt-/Implementierungsebene liegen.

FAZ: KI-Deals und Perplexity Publisher Program unter der Lupe

Für die FAZ schrieb ich über KI-Deals (60 Millionen $ von Google an Reddit) und habe mir dafür das Perplexity Publisher Program angeschaut:

Die Verlagspartner werden für das Einbeziehen ihrer Inhalte als Quellen an den künftigen Werbeeinnahmen beteiligt. Die Werbung wird in den verwandten Fragen am Ende der Antworten auf Perplexity angezeigt werden. Die verwandten Fragen werden außerdem als Technologie auf den Websites implementierbar. Kostenfrei.

Der nächste offensichtliche Schritt, sollte das Werbemodell funktionieren, wäre Richtung Werbenetzwerk auf der Perplexity-Plattform: Die Möglichkeit für Publisher nicht nur an den synthetisierten Zusammenfassungen ihrer Inhalte auf Perplexity mitzuverdienen, sondern die gleiche Werbeform auch auf den eigenen Websites einzublenden. Dann natürlich mit einer anderen Umsatzaufteilung.

Zu dieser potenziellen Richtung passt, dass Perplexity bereits jetzt den Partnern die Möglichkeit geben wird, die Werbeplätze unter ihren Quellen mit eigenen Werbekunden aufzufüllen. Es soll eine Werbeplattform werden, die alle Richtungen abdeckt.

Im Grunde sprechen wir von einem Werbemodell, das einerseits eine Erlösbeteiligung im YouTube-Stil bietet und andererseits in alle Richtungen implementiert werden soll (auf Perplexity, auf den Publisher-Websites).

KI-Nutzung

Im Rahmen des Textes ging ich auch auf eine Studie in Dänemark ein. Bereits 15% in Marketing, Journalismus und IT zahlen dort für ChatGPT Plus. Bemerkenswert.

SAP arbeitet an Modell für Geschäftszahlenanalyse

Das „SAP Foundation Model“ zielt darauf ab, bei der Vorhersage von Umsätzen und Bezahlverhalten zu glänzen.
Laut SAP-Vorstand Jürgen Müller übertrifft das Modell in internen Vergleichen bereits GPT-4 in geschäftsrelevanten Anwendungsfällen.
Das Modell könnte bereits dieses Jahr verfügbar sein und soll auf anonymisierten Geschäftsdaten trainiert werden.

SAP Plant KI-Modell Für Geschäftszahlen Und Will GPT4 Übertrumpfen:

"Wir wollen die Ersten sein, die ein tabellenorientiertes KI-Modell auf den Markt bringen“, sagte SAP-Technologievorstand Jürgen Müller dem Wirtschaftsmagazin Capital (Ausgabe 9/2024).
Das sogenannte „SAP Foundation Model“ soll demnach vor allem im Umgang mit Zahlen und Tabellen brillieren – etwa bei der Vorhersage von Umsätzen, Lieferantentreue und Bezahlverhalten. „Nach ersten internen Vergleichen sind wir mit unserem Foundation Model bei einigen geschäftsrelevanten Anwendungsfällen jetzt schon besser als GPT-4 und andere große Sprachmodelle“, sagte Müller mit Blick auf das Kernprodukt des Marktführers OpenAI.
SAP trainiere die Modelle auf anonymisierten Geschäftsdaten seiner Kunden.

Das ergibt Sinn:

Es passt in SAPs B2B-Position. Und sie haben Zugang zu Kunden, die ihnen anonymisiert Daten für das Training zur Verfügung stellen können. Der Anreiz für die Unternehmenskunden (welche bereits SAP-Kunden sind), Trainingsdaten bereitzustellen, ist auch klar: Wenn meine historischen Daten bereits in das Training einfließen, kann das Modell viel besser auf meine künftigen Situationen angewandt werden, ohne viel Finetuning dazwischen zu legen.

Das hier ist allerdings wieder typische deutsche Arroganz: "Wir wollen die Ersten sein, die ein tabellenorientiertes KI-Modell auf den Markt bringen“

Ich habe jüngst erst für die FAZ über LLMs für Vorhersagen zu Zahlenreihen geschrieben: Zeitreihenanalyse 2.0: Wie Foundation-Modelle Wirtschaftsprognosen verändern

Entscheidend ist hier vor allem der neue Trend der aufkommenden sogenannten Foundationmodelle im Forecasting-Bereich, die unter anderem domänenübergreifend einsetzbar sein sollen. Wenn Prognosen on demand möglich sind, verändert sich der Umgang mit ihnen. Wir sehen das an den Wettervorhersagen, für die heute keine U-Boote mehr in Feindesgebiet geschickt werden. Mehr noch, als Wettervorhersagen täglich für die klassischen Medien vorgenommen wurden, wurden sie vorher von Menschen abgenommen. Mit dem Aufkommen von Smartphones stieg auch der Anspruch der Menschen an die Wettervorhersage. Die neue Erwartung waren stündliche Vorhersagen, besser noch minütliche. Die Folge: Automatisierung. Die Anbieter können das natürlich nicht von Menschen abschließend prüfen lassen. Gleichzeitig ändert sich die Wettervorhersage, stündlich oder minütlich, und ist je nach Anbieter sehr präzise. Eine Fünftagessicht dagegen weniger. Der gesamte Forecasting-Sektor gerät dank der Fortschritte im Deep Learning in Bewegung und wird vergleichbar neue Werkzeuge und interne neue Prozesse für Unternehmen hervorbringen.

(Mit diesem Text habe ich meine Eingliederung in den FAZ-Kosmos erfolgreich abschließen können, in dem ich erstmals eine Referenz zu U-Booten im 2. Weltkrieg unterbrachte.)

Modell-Mix: Der AI-Scientist

Sakana AI, ein japanisches Startup, hat einen KI-System entwickelt, das eigenständig Forschung betreibt.

Der AI Scientist generiert Ideen, experimentiert, schreibt wissenschaftliche Papers und bewertet seine Arbeit selbst.
Der Prozess umfasst vier Schritte: Ideenfindung, Experimentieren, Paper schreiben und Feedback nutzen.
Sakana AI gibt an, dass die Kosten für ein Paper bei etwa 15 US-Dollar liegen, die Dauer eines Durchlaufs bleibt jedoch unklar.
Erste Tests zeigen Fortschritte, aber auch Herausforderungen wie visuelle Limitierungen.

t3n:

Sakana AI ist kein unbekanntes Startup im KI-Bereich. Zuletzt hatte das Unternehmen eine künstliche Intelligenz vorgestellt, die automatisch weitere KI-Programme erschaffen kann. Nun stellt das Unternehmen sein neues Projekt vor: den AI Scientist.
Der AI Scientist soll wissenschaftliche Forschung betreiben, indem er eigenständig Ideen verfolgt, wissenschaftliche Untersuchungen anstellt und diese im Anschluss auswertet, um weitere Schlüsse daraus zu ziehen. Sakana AI behauptet, dass der AI Scientist das „erste umfassende System für vollautomatische wissenschaftliche Entdeckungen“ ist.
Doch damit nicht genug: Am Ende kann die KI ihre wissenschaftliche Arbeit laut Startup sogar quasi selbst bewerten. Dabei greift eine zweite KI, die allein darauf spezialisiert ist, Paper zu analysieren. Sakana AI behauptet, dass diese KI in der Lage wäre, Paper mit menschenähnlicher Genauigkeit zu bewerten. Das Feedback kann dann wieder vom AI Scientist genutzt werden, um eine weitere Iteration der Forschungsarbeit zu erstellen oder diese Erkenntnisse in zukünftigen Papern zu verarbeiten.

In erster Linie ist das ein erstes Experiment von vielen, was mit einem Modell-Mix erreicht werden kann.

Modell-Mixe finde ich fast schon spannender mittlerweile als das, was bei den einzelnen großen Modellen passiert.

(Natürlich kann das vorgestellte System missbraucht werden, und natürlich ergibt es keinen Sinn, viele automatisierte Paper zu erstellen. Aber wer hier nicht die zarten Anfänge einer Revolution in der Forschung/Wissensgenerierung sieht, dem ist nicht mehr zu helfen.)

🎛 Plattformen

Apple vs. Patreon

Apple zwingt Patreon, ab November 30% Provision auf iOS-Abonnements zu erheben, um im App Store zu bleiben.
Bei einem $10-Abonnement erhält der Creator nur $6.44, nachdem $3 an Apple und $0.80 an Patreon gezahlt wurden. Ben Thompson konzis und bitter dazu: "1,000 true fans is now 1,553 true fans-who-subscribe-on-iOS."
Das Gebührenmodell von Apple führt dazu, dass kreative Plattformen wie Patreon stark belastet werden. "Apple is treating every individual creator as if they are a subsidiary of Patreon."

Das Verrückte hier: Apple behandelt die Creators auf Patreon (YouTuber, Podcaster, Blogger etc) als wären sie Entwickler:innen, die für iOS Apps schreiben.

Thompson auf Stratechery hat die vernünftige Lösung parat:

Eine mögliche Lösung wäre, dass Patreon seine eigenen 8% Gebühr behält und Apple 30% von Patreon erhält. "This fits Apple’s claimed logic for the App Store."

Also statt 30% nur 2,4% von der Transaktion (30% von den 8%, die Patreon erhält). Das wäre fair und sinnvoll und ist natürlich nur ein Bruchteil der 30%.

Am erstaunlichsten ist hier, wie blind Apple gegenüber der Warhehmung des Unternehmens in der Öffentlichkeit ist und vor allem wie sehr sie die aktuelle regulatorische Realität ausblenden.

Dazu passt was John Gruber, der weltweit bekannteste Apple-Fan, dazu schreibt: Patreon Should Consider Calling Apple on Its Threats:

What Patreon seems to be suggesting above is that if they offered a third option — not to allow subscriptions within the iOS app, controlled by each creator for their own subscriptions — that Apple has threatened to remove the Patreon app from the App Store.
I humbly suggest Patreon go ahead with that anyway. Let’s see how many of Patreon’s creators tell Apple to bugger off. And if Apple were to respond by removing Patreon from the App Store for offering this choice, how would that not backfire spectacularly in Apple’s face? I believe it would be a positive publicity bonanza for Patreon, and for high-visibility creators on their platform, as well. And this example would be a disaster for Apple publicity-wise and in the face of growing regulatory and antitrust scrutiny, especially right here in the U.S.

🚌 Transportsektor

Chinesisches Robotaxi-Startup WeRide bekommt Genehmigung für Passsagiertransport in Kalifornien

Via TechCrunch:

WeRide hat die Genehmigung erhalten, seine autonomen Fahrzeuge mit Passagieren in Kalifornien zu testen.
Die Genehmigung erfolgt, während WeRide sich auf einen möglichen Börsengang in den USA mit einer Bewertung von nahezu 5 Milliarden Dollar vorbereitet, angesichts zunehmender Bedenken in den USA bezüglich chinesischer Technologie.
WeRide hält zwei Genehmigungen in Kalifornien, die das Testen von Passagieren mit und ohne Sicherheitsfahrer erlauben, kann jedoch noch keine Gebühren von Passagieren erheben oder den Dienst der breiten Öffentlichkeit anbieten.
WeRide wurde 2017 gegründet.

Aktuelle Wirtschaftsnachrichten in Deutschland, Handelsblatt:

Im größten Pkw-Markt der Welt erodieren die Verkäufe von Benzinern -- und damit das Geschäft von VW, Mercedes, GM oder Honda. Chinas Elektroautobauer drängen die Konkurrenz aus dem Land.

Die nächste Stufe, die Robotaxis, steht schon in den Startlöchern.

Wenn wir nicht aufpassen, erleben wir in den nächsten 20 Jahren das exakte Gegenteil vom deutschen Wirtschaftswunder. Einen beispiellosen Absturz.

🛒 Onlinehandel

Kroger: flexible Preisbildung auf Kundenprofilbasis und Gesichtserkennung

In den USA plant Kroger, Preise basierend auf Kundenprofilen anzupassen. Was Politiker:innen auf den Plan rief:

Senatorin Warren betont, dass digitale Preisgestaltung Surge Pricing ermöglichen könnte, z.B. bei Wasserpreisen an heißen Tagen.

Surge Pricing kennen wir von Uber. Bei Dienstleistungen mit begrenztem Angebot ergibt das auch Sinn. Aber für den kompletten Handel?

Was diese Technologie vor allem macht, ist Vertrauen bei den Konsument:innen gegenüber dem Händler zu verringern.

‘Dynamic Pricing’ at Major Grocery Chain Can Vary Prices Depending on Your Income:

Since its introduction in 2018, Kroger’s dynamic pricing strategy has expanded to 500 of its nearly 3,000 stores. This includes a partnership with Microsoft to develop the Enhanced Display for Grocery Environment, a digital shelving label system. The technology allows employees to adjust prices with ease, adapting to factors such as time of day and demand — and sometimes even a shopper’s personal info, like preferences and income.
“The EDGE Shelf helps Kroger gather and exploit sensitive consumer data,” the senators wrote. “Through a partnership with Microsoft, Kroger plans to place cameras at its digital displays, which will use facial recognition tools to determine the gender and age of a customer captured on camera and present them with personalized offers and advertisements on the EDGE Shelf.”
Kroger, which is considering a significant expansion through a $24.6 billion acquisition of Albertsons, reported an operating budget of $3.1 billion last year, maintaining gross profit margins above 20% for the past five years.

Seoul findet (schon wieder) gefährliche Stoffe in Produkten bei Temu und Shein (warum nicht die EU?)

Seoul-Behörden sind fleißig, das hier ist das zweite oder dritte Mal dieses Jahr: Sie fanden in Produkten von Shein, Temu und AliExpress toxische Substanzen, die teils hunderte Male über den zulässigen Werten lagen.
Die Behörden forderten die Rücknahme der betroffenen Produkte und kündigten an, regelmäßige Sicherheitstests durchzuführen. ~ Seoul Authorities Find Toxic Substances in Shein and Temu Products:

In the most recent inspection, 144 products from Shein, AliExpress and Temu were tested, and multiple products from all companies failed to meet legal standards.
Shoes from Shein were found to contain significantly high levels of phthalates – chemicals used to make plastics more flexible – with one pair 229 times above the legal limit.
"Phthalate-based plasticisers affect reproductive functions such as sperm count reduction, and can cause infertility and even premature birth," an official from Seoul's environmental health team told AFP.
Seoul authorities found sandals from Temu contained lead in the insoles at levels more than 11 times the permissible limit.

Von der EU, die so stolz auf ihre Regulierung ist, habe ich noch nichts dergleichen gelesen. Warum eigentlich?

✴️ Mehr Wissenswertes

Energierevolution-Watch: Exponential View berichtet darüber, wie pakistanische Bürger:innen und Organisationen en masse Solar-Panels kaufen. (Unter anderem weil die Energieversorgung im Land unzuverlässlich und teuer ist.)

Pakistan importierte im ersten Halbjahr 2023 13 GW an chinesischen Solarmodulen, was 30% seiner gesamten Erzeugungskapazität entspricht.
Der Wandel hin zu Solar- und Batterietechnologien wird Energie-Selbstversorgung in Ländern wie Pakistan fördern, ohne auf zentrale Institutionen angewiesen zu sein.

Exponential View:

Evidence mounts to support this case. Pakistan has become the third-largest importer of Chinese solar modules, acquiring a staggering 13GW in the first half of this year alone. To give you some international comparisons, the UK is only on course to add 1.5-2GW of solar capacity this year. In 2023, the US economy added 32GW of solar capacity.
This likely means Pakistan will be the sixth-largest installer of solar panels this year. But in local terms, it is more significant. The country’s entire electrical generation capacity was only 46GW in 2023.
In other words, in just six months, Pakistan imported solar capacity equivalent to 30% of its total electricity generation capacity - an absolutely staggering amount. But this is based on Chinese trade data, not actual installations. If this capacity isn’t showing up in grid statistics, where is it going?...

Google, Android und KI: Google hat diese Woche sein neues Pixel-Phone vorgestellt.

Integration and Android:

What Google is proposing is something different entirely: you can pick your device, but your AI will be integrated with your data primarily via the cloud; the company can pull that off because they own both Android and the cloud.

OpenAI plant eine Investition in Höhe von 60 Millionen US-Dollar in das Startup Opal Camera Inc. für hochauflösende Webcams.

Die neue Produktlinie könnte Technologien von OpenAI integrieren, um Bild- und Videoerstellung zu unterstützen. Aber abseits dieser Integrationsoption: Warum?

(Silicon Angle)

Robozustellungen expandieren in den USA. Das hatte ich ziemlich aus den Augen verloren.
Fast Company: Shake Shack Will Use Robots to Deliver Uber Eats Orders in Los Angeles:

Uber’s food delivery arm has been offering Serve’s autonomous deliveries in Los Angeles since 2022 and is focused on tapping more geographies across the U.S.
For Serve, the tie-up with Shake Shack would speed up its efforts to achieve its target of deploying up to 2,000 AI-powered sidewalk delivery robots on the Uber platform in 2025.