11. Juli 2025 Lesezeit: 12 Min.

Briefing 267: KI-Browser sind der neue Plattformkampf

KI-Browser hier & jetzt, Implikationen und Aussichten

Briefing 267: KI-Browser sind der neue Plattformkampf

Hi,

Perplexity hat diese Woche den lang angekündigten KI-Browser Comet für erste Nutzer:innen gelauncht. Ich benutze seit einigen Wochen den KI-Browser Dia von The Browser Company und habe nun mit Comet die Gelegenheit gehabt, einen zweiten KI-Browser zu testen. Wer das Briefing schon länger liest, weiß, dass ich KI-Browser als wichtigen nächsten Schritt in KI sehe.

Wegen alldem gibt es heute eine etwas andere Sonderausgabe des Briefings mit einem Schwerpunkt: KI-Browser. Diese Ausgabe ist außerdem komplett öffentlich verfügbar.

Marcel

Im Fokus dieser Ausgabe:

  • Warum KI-Browser? Weil Browser als Zugangspunkt für KI-Agenten einfacher grundsätzlich und strategisch günstiger zu bauen sind als neue Betriebssysteme und dort die Schnittstelle zu Nutzer*innen und Aufgaben liegt.
  • Im Einsatz: Eigene Erfahrungsberichte zeigen praktische KI-Browser-Funktionen, wobei ihre Möglichkeiten und Limitationen im Alltag gut sichtbar werden.
  • KI und Handel als Beispiel: Standardisierte Webshops werden zunehmend von KI für User bedient, wodurch Content, Reputation und Service wichtiger werden, aber Zusatzdienste schwieriger verkauft werden. Oder wird Content doch weniger wichtig?
  • Kommende Iterationen: KI-Browser werden sich schnell weiterentwickeln, werden noch stärker cloudbasiert, das Chat-UI bleibt suboptimal; langfristig könnten sie als Basis westlicher Superapps dienen.

KI-Browser sind hier

Bereits (mehr oder weniger) verfügbar:

Nicht überraschend und sicher völlig zufällig berichtete Reuters diese Woche, parallel zum Comet-Launch, dass auch OpenAI in den nächsten Wochen einen KI-Browser starten wird. Nicht überraschend, weil OpenAI bereits vor einem Jahr unter anderem ehemalige Chrome-Leute eingestellt hat.

Warum bauen so viele jetzt KI-Browser?

Der Hauptgrund lässt sich so zusammenfassen: Einen Browser bauen ist einfacher als ein Betriebssystem bauen. Ganz zu schweigen von dem, was nach dem Bau kommt. Ein neues Betriebssystem heute zu etablieren, ist nahezu unmöglich. Selbst bei Erfolgsaussicht würde es mindestens ein Jahrzehnt oder länger dauern.

Stattdessen lässt sich fast alles mit dem Browser abdecken. Vorerst.

Denn es geht auch, wie ich im März schrieb, um den Zugang der KI zu nicht-öffentlichen und persönlichen Dingen:

Die KI geht wie die Nutzer:innen über deren Browser in deren Onlineaccounts.

Unabhängig von den Branchenüberlegungen gibt es noch ein Argument für KI im Browser. Agenten können heute bereits erstaunlich viele Dinge (siehe unten), aber sie können noch bei weitem nicht alles. Und die User müssen erst lernen, was KI-Agenten für sie machen können.

Statt sich diese Gedanken vorher zu machen und dann die KI loszuschicken, ist die KI hier genau an der Stelle, an der sich die Aufgaben türmen: Im Browser.

Ich mache etwas und stelle dabei fest, dass ich die KI um Hilfe bitten kann. Ich kann nach der Hilfe die Aufgabe selbst zu Ende führen oder die KI wieder losschicken. Dieses Hin-und-her, diese Aufteilung der Aufgaben zwischen Mensch und KI ist der beste aktuelle Weg, was Technikstand als auch unser Verständnis der Technik für unseren Alltag angeht.

Hier & Jetzt: Comet und Dia im Einsatz

Wenn man einen KI-Browser gesehen hat, hat man alle gesehen, könnte man meinen. KI in der Sidebar, Ende der Geschichte. Meine erstaunlichste Erkenntnis diese Woche war, wie sehr sich Dia und Comet bereits unterscheiden.

Die größte Gemeinsamkeit neben der Sidebar: Das clevere, von Dia eingeführte Design, Tabs per @ im Chat zu referenzieren. (Kryptischen Aussagen des Dia-CEOs zu folge, hat sich Perplexity hier schnell inspirieren lassen.)

Der größte Unterschied zwischen beiden liegt bereits in der Tatsache, wie die KI in der Sidebar im Browser integriert ist. Bei Dia ist die Sidebar stärker an den Tab gebunden. Jeder neue Tab geht ohne Sidebar auf, sie muss erst aufgerufen werden. Bei Comet ist die Sidebar, der „Assistent“, immer geöffnet wenn die Nutzer:in das möchte. Text verschwindet und wird eingescrollt je nach dem auf welchen Tab man geht. Das ist mindestens gewöhnungsbedürftig. Man sieht aber bei beiden Ansätzen die Überlegungen dahinter. Die Pfade sind gesetzt.

Dia hat eine sehr nützliche Funktion namens Skills. Skills sind vorgelagerte Prompts wie bei Custom GPTs in ChatGPT oder bei Projects in Claude.

Hier ein Shoppingvergleich-Skill im Einsatz auf Amazon:

Der Unterschied im Sidebarverhalten dürfte auch daher kommen, dass Comet bereits als „agentic Browser“ startet. Comet kann im Gegensatz zu Dia selbständig Dinge auf Websites ausführen.

Wichtig: Beide können mehrere Tabs in ihre Aufgaben einbeziehen. Die Grenzen hier werden vor allem von der Fantasie der User bestimmt.

Hier ein paar Inspirationen von Perplexity, was User damit machen können sollen:

Ich habe ein Experiment mit deutschen Lebensmittellieferanten durchgeführt. Auf der K5 habe ich getestet, wie gut es funktioniert, die Zutaten von einem Rezept auf Chefkoch.de auf Knuspr und Flaschenpost zu sammeln. Kann die KI die Zutaten richtig auslesen, die entsprechenden Produkte bei den Onlinehändlern finden und mir sagen, was es jeweils in Summe kosten würde?

Nunja, das Auslesen bei Chefkoch und die Übersetzung in die Produkte war kein Problem. Bei den Preisen versagt Dia dann allerdings und nannte bei vielen Zutaten falsche Preise. Es ist unklar, welche KI-Modelle Dia im Hintergrund benutzt. Möglich, sogar wahrscheinlich, dass Dinge wie dies heut oder morge in Dia bereits funktionieren. Denn es ist technisch heute möglich.

Ich habe das Gleiche bei Comet getestet. Comet hat die richtigen Preise ausgelesen.

Dann erinnerte ich mich daran, dass Comet als „agentic Browser“ beworben wird und dachte, ich versuche mal, ob der Browser den Warenkorb beim tchechischen Anbieter Knuspr auch eigenhändig befüllen kann. Kann es:

Natürlich muss das Ergebnis noch von Hand gecheckt werden. Aber insgesamt ist das schon recht beindruckend.

Dass der KI-Agent bei Comet direkt den Browser auf dem Rechner benutzt, sollte man immer mitdenken. Hier habe ich den Assistenten auf einen Ordner in meinem Feedreader losgelassen:

Anschließend waren 20 Einträge als gelesen markiert. Denn der Webservice ist so konzipiert, dass ein Mensch i Browser die Einträge aufruft und liest und diese dann automatisch als gelesen markiert..

Comet hat Widgets für leere neue Tabs. Keine neue Browser-Funktion, aber hier lassen sich KI-Aufgaben ablegen, die schnell abgerufen werden können. Die Ursuppe für ein kommendes Launchpad kleiner personalisierter ‘Apps‘, wenn man so will:

Comet zeigt bereits heute, wie mächtig und vor allem zugänglich für normale Uer:innen KI-Agenten im Browser-Umfeld sind.

Hier noch weitere Vorschläge von Perplexity, was mit ihrem Browser gemacht werden kann:

Dias Interface ist leichter verständlich. Perplexitys Comet spricht eher Poweruser an. Dass die Suche Perplexity in einem Tab in Comet geöffnet, plötzlich auch die anderen Tabs im Browser sehen kann, wenn man sie per @ referenziert, ist erst einmal etwas, das irritiert. Es zeigt hier aber auch deutlich, dass beide Unternehmen aus unterschiedlichen Richtungen auf das Thema zugehen.

Ich vermute stark ein neues UI-Spielfeld hier, während die Player herausfinden, was funktioniert und was nicht.

Offensichtliche und weniger offensichtliche Implikationen

Ein paar mehr oder weniger offene Fragen, die ich mir seit einigen Monaten in Bezug auf KI-Browser im Speziellen und bei KI-Agenten allgemein stelle:

  • Alles, was wir im Internet anbieten -Onlinehandel, Publikationen, Plattformen, Services- wurde mit dem gar nicht mitgedachten, weil offensichtlichen Gedanken gebaut, dass das legitime Publikum, die Kundschaft, die Community, wie auch immer, Menschen sind, die per Hand hier landen und per Hand hier interagieren. Was verändert sich alles, wenn diese Menschen KI-Agenten losschicken? (Die Historie von SEO und dem vergleichsweise dummen Google-Bot gibt uns einen Hinweis auf eine Art von Dynamik, aber nicht auf das ganze Bild.)
  • Wenn ich zahlender Abonnent vom Economist, FAZ oder Spiegel etc. bin, dann werden die Archive dieser Publikationen für mich auf einmal sehr viel wertvoller, wenn ich mit einem KI-Browser bewaffnet bin. Dieser kann für mich durch das Archiv gehen und finden, was ich suche. Ein neues Interface. Was bedeutet das für die Publikationen?
  • Wann möchte ich mich voll integrieren und in der KI gefunden werden und dafür die Kontrolle über mein Angebot verlieren? Das ist keine Ja/Nein-Frage.

Hier habe ich Comet losgeschickt, das Archiv des Economist zu durchsuchen. Der Economist war in einem Tab mit meinem eingeloggten Account offen.

KI-Browser und der Onlinehandel

Nehmen wir beispielhaft den Onlinehandel.

Wie wir bereits oben sehen konnten, können die ersten KI-Browser beziehungsweise die im Hintergrund laufenden KI-Agenten Onlineshops bedienen. Lebensmittelanbieter wie Knuspr sind da noch eine größere Herausforderung für die KI. Das Gros des Onlinehandels ist es nicht: Es gibt kaum eine Branche, die so besessen von Best Practices und Optimierungen ist, wie der Onlinehandel. Das liegt vor allem daran, dass historisch seit Bestehen der Branche der Hauptdiscoveryweg ein vergleichsweise starres Machine-Learning-System ist, für das es eine überschaubare Zahl an Regeln gab. Wir kennen es unter dem Namen Google. Der zweite Grund ist die Messbarkeit der Aktivitäten potenzieller Kund:innen.

Die direkte Folge: KI-Browser mögen noch an der Bedienung von Figma scheitern, auch weil es nicht Tausende standardisierte Figmas gibt. Aber die KI kann Webshops bedienen, weil es ein bisschen sehr viel mehr als Tausend standardisierte Webshops weltweit gibt.

Dieser Umstand plus die Tatsache, dass die ersten Payment-Anbieter wie Stripe Einmal-Kreditkarten für den sicheren Einsatz beim KI-Shopping eingeführt haben, machen den Onlinehandel prädestiniert dafür, zu den ersten Zielscheiben der KI zu zählen.

Auf der Onlinehandelskonferenz K5 wurde dieses Jahr auch viel über Strategien in einer KI-Welt gesprochen. Guter Content wird wichtiger, habe ich öfter gehört. Das ist durchaus nicht falsch. Aber ist es wirklich allgemein gültig? Ich meine, dass hier der eigentliche Paradigmenwechsel noch nicht richtig internalisiert wurde:

KI zerbröselt das Interface.

Bisher hatten wir die eigenen Angebote und einer Disintermediation der Discovery. Diese fand statt über Plattformen wie der Google-Suche und Marktplätzen wie Amazon. Onlinehändler haben keine Kontrolle über die Google-Suche und ihr Ranking, sie können letzteres nur optimieren; und Werbung kaufen. Marktplatzverkäufe haben keine Kontrolle über ihr Ranking auf Amazon, sie können es nur optimieren; und Werbung kaufen.

Bei Marktplätzen verlieren die Händler außerdem die Kontrolle über die Darstellung. Als Marktplatzverkäufer kann ich einzelne Segmente meiner Produktseiten gestalten, aber nur Segmente. Auf jedem Marktplatz gibt es Segmente bei den Produktseiten, wo Konkurrenten ihre Produkte bewerben können. Wettbewerb! Ähnliches gilt für alle Plattformen: Videocreators haben eine Onlinepräsenz auf YouTube, auf der die Plattform immer auch andere Creators bewirbt.

KI treibt das auf die Spitze und zerbröselt alles in seine Informationsbausteine.

Also: Ich will als Onlinehändler von der KI gefunden und ausgewählt werden. Guter Content kann hier helfen. Aber spielen wir die Szenarien einmal durch: Die Userin nutzt die KI (im Browser oder anderswo) für ihre Kaufentscheidung. Die KI sucht Informationen zum Produkt: Lieferzeiten, Lieferkosten, Preise, Reviews, Informationen zum Produkt, Alternativen. Jeder dieser einzelnen Punkte kommt von unterschiedlichen Seiten. Nur weil ich sehr gute Informationen zum Produkt auf meinem Angebot habe, muss die KI nicht meinen Kaufbutton auswählen.

Vielleicht werden zerbröselte Onlinehändler komplett reduziert auf Execution und Preis? Das ist im Google-Umfeld bereits der Fall, kann hier aber noch extremer werden: Wenn ich die KI losschicke, und die KI im Zweifel auch den Einkaufsprozess für mich übernimmt, dann sehe ich in diesem Szenario nicht ein einziges Mal das Webangebot des Onlinehändlers. Das Webangebot kann also hässlich wie die Nacht sein, ohne dass das die Conversion verringert.

Wichtiger wird vielleicht: Wie gut meine Reputation ist bei Lieferung, Reklamationen etc. Oder zumindest, was die KI über meine Reputation weiß.

Vielleicht auch: Die Kund:innen klicken/tippen auf die Fotos in der KI-Übersicht, weil sie sich selbst ein besseres Bild machen wollen, bevor sie kaufen.

Nur eins scheint mir aktuell sicher zu sein: Das dominierende Kaufverhalten wird noch stärker als bereits der Fall von der Produktkategorie abhängen.

Darüber hinaus gibt es mindestens eine Sache zu bedenken:

Verkäufe über KI minimieren die Chance zur nackten Transaktion etwa Zusatzdienste, verwandte Produkte, Newsletter-Rabatte oder gar Upselling unterzubringen. Die KI kann manches davon aufnehmen, aber das ist hier der Punkt: Nicht der Onlinehändler entscheidet, was die Kund:innen sehen oder nicht sehen sondern die KI. Act accordingly.

Hier habe ich in Dia ein Produkt auf Otto einem Vergleich unterzogen:

Immerhin ist die Produktseite des Händlers oder Marktplatzes in diesem Szenario noch im Mix.

KI bietet enormes Potenzial für den Onlinehandel. For starters: Wenn das Web zur allgemeinen Programmierschnittstelle der KI-Browser wird, gewinnt die Website wieder an Bedeutung. Je nach Strategie verlieren mobile Apps damit an Bedeutung. Perfekt für eine Branche, die ernsthaft 2024 immer noch debattierte, ob es mobile Apps braucht.

Und: An vielen Stellen wird es sich der Onlinehandel gar nicht aussuchen können.

Die standardisierten Webshops + die sie bedienende KI bedeuten im Grunde das Entstehen einer Welt, die den Marktplätzen in der Dynamik ähnlich ist, mit dem entscheidenden Unterschied, dass die Setupkosten bei den Onlinehändlern im Zweifel bei Null sind. (Weil der KI-Browser den Webshop einfach bedienen kann wie ein Mensch.)

Iterationen und Roadmaps

Ich war lange skeptisch, was das Chat-Interface bei KI angeht. Die Tatsache, dass neben der Transformer-Architektur das Chat-Interface von ChatGPT (mit der entsprechenden Modell-Anpassung) der zweite Hauptgrund war für die KI-Explosion, die wir gerade erleben, hätte mich meine Position früher hinterfragen lassen sollen. Ja, das Chat-Interface hat die gleichen Probleme wie jede Kommandozeile, namentlich vor allem die schlechte Discovery der Möglichkeiten für die User. Aber es ist in einer Welt dominiert von Messengern auch ein Interface, das alle verstehen.

Ähnliches gilt für den Browser. KI-Browser sind nicht der optimale Formfaktor für KI-Interfaces. Aber sie sind der optimale Startpunkt. Weil wir Browser kennen.

Wir hatten hier im Briefing bereits einige Male darüber gesprochen, was KI-First bedeuten wird, vor allem mit Blick auf die Frage, wie KI-First-Gadgets von OpenAI und anderen aussehen werden. Der dortige Blickwinkel gilt natürlich auch für KI-Browser: State-of-the-Art KI kommt aus der Cloud. Lokale Modelle können als Task-Orchestratoren arbeiten. Aber sie werden auf absehbare Zeit Tasks an Modelle in der Cloud abgeben, weil die großen Modelle schlicht die leistungsfähigsten sind.

KI-Browser sind damit eine recht undurchschaubare Gemengelage aus lokalem Programm und Cloud-basierten Funktionen.

Sowohl Dia als auch Opera Neon schicken Anfragen im Chat an Modelle in der Cloud. Noch anschaulicher ist es bei Comet: Im Browser von Perplexity verschwimmen der Sidebar-Assistent und der Webservice miteinander, wenn man in einem Tab den Webservice Perplexity öffnet und dort Tabs mit @ referenzieren kann.

Das gibt uns bereits einen Hinweis auf die kommenden Iterationen.

Es ist jetzt toll, der KI zuzusehen, wie sie im Tab arbeitet. Aber notwendig ist das nicht immer. Nicht nur KI-Vorgänge als auch die Darstellung derselben werden sich mittelfristig vom Tab, also der Website, lösen. Man kann den Browser im Hintergrund „losschicken“, und in Wirklichkeit passiert alles in der Cloud des Anbieters in virtuellen Browsern.

Amazons Buy for me und Googles agentischer Checkout oder auch Project Mariner sind bereits Beispiele für das, was hier kommen wird. Für Laien wird es „im Browser“ passieren, egal wie groß der Cloud-Anteil ist.

Der nächste Schritt sind mobile Companions dieser KI-Browser. Auch diese werden zunächst wie Browser auf dem Smartphone erscheinen. Die KI-Funktionen werden zunehmen. Die Darstellung wird sich verändern. Brösel hier, Brösel da.

Und zack, schon haben wir den ersten tatsächlich nachvollziehbar realistischen Weg hin zu westlichen Superapps. Superapps, die den Namen verdienen wie WeChat in China. Apps, in denen alles abgedeckt wird.

Das ist zumindest die sehr wahrscheinliche langfristige Roadmap für OpenAI, Perplexity, Dia und Co. Und deren Wunsch. Ob es so kommt, ist natürlich offen.

Fazit

Vibe Browsing kommt. Gemessen an der Wucht von ChatGPT, das jetzt bereits nach nicht einmal drei Jahren bei um 800 Millionen aktiven Nutzer:innen weltweit liegen soll, können auch die KI-Browser sich schnell ausbreiten. Gemessen an den ersten persönlichen Erfahrungen kann ich sagen, dass sich KI-Browser wie der logische nächste Schritt in der Interaktion mit KI anfühlt. Es wird mehr möglich, und die Nutzung des Browsers gibt dem Nutzer Ideen, die KI zu benutzen, die zwar auch im ChatGPT-Interface möglich sind, dort aber eine Abstraktionsebene zu weit weg liegt. Die legitimen Kundenbots kommen. Was bedeutet das für uns? Wir werden es schnell herausfinden.

Es ist natürlich noch offen, was von dieser Technologie kostenfrei im Browser angeboten werden kann. Comet ist Teil von Perplexity Pro, Dia wird kostenpflichtig, Opera Neon ist es auch. Das liegt in der Natur der Inferenz-Sache. Aber nur Verrückte (wie yours truly) bezahlen für Browser. Für den Mainstream muss der KI-Browser kostenfrei sein.

Ein bisschen mit Comet Dinge ausprobieren und eins wird offensichtlich: Nicht nur Browser. Eine First-Party-Integration einer KI in das Betriebssystem, welche semantisch User Interfaces der Apps versteht und als zusätzliches Interface diese bedienen kann und mehrere Tasks verbinden kann und das über verschiedene Apps hinweg, das birgt nicht nur enormes Potenzial sondern ist auch gar nicht mehr so weit weg.

Je standardisierter ein Interface oder je verbreiteter, desto eher wird es von der KI steuerbar. Und mit der KI-Steuerung kommt die Zerbröselung.

Es gibt noch keine Invites für Comet. Ich habe allerdings 5 Invites für Dia zu vergeben. Interessierte Abonnent:innen können mir mit ihrer Emailadresse schreiben. First come, first serve. Bei gleichzeitiger Anfrage werden zahlende Mitglieder bevorzugt.

Marcel Weiß
Unabhängiger Analyst, Publizist & Speaker ~ freier Autor bei FAZ, Podcaster auf neunetz.fm, Co-Host des Onlinehandels-Podcasts Exchanges
Inhaltsverzeichnis
Großartig! Du hast Dich erfolgreich angemeldet.
Willkommen zurück! Du hast Dich erfolgreich eingeloggt.
Du hast neunetz.com erfolgreich abonniert.
Dein Link ist abgelaufen.
Erfolg! Suche Dein in Deiner E-Mail nach einem magischen Link zur Anmeldung.
Erfolg! Deine Zahlungsinformationen wurden aktualisiert.
Deine Abrechnung wurde nicht aktualisiert.