Xiaomis stiller Hinterhalt
In einer einzigen Woche hat der Konzern drei KI-Initiativen gleichzeitig gestartet. Goldman Sachs sieht Xiaomi auf dem Weg zum „Marktführer für Physical AI“
Published on Mar. 30, 2026

Image: Xiaomi
"Ich nenne es einen stillen Hinterhalt, nicht weil wir es so geplant haben, sondern weil der Wechsel vom Chat- zum Agenten-Paradigma so schnell erfolgte, dass wir es selbst kaum glauben konnten", schrieb Luo Fuli vergangene Woche auf X.
Luo forschte früher bei DeepSeek. Jetzt arbeitet er bei Xiaomi und leitet dort die Entwicklung von MiMo, dem hauseigenen Großmodell des Konzerns.
Der Hinterhalt, von dem Luo spricht, bestand aus drei gleichzeitigen Vorstößen im Bereich der künstlichen Intelligenz in einer einzigen Woche. Innerhalb kurzer Zeit stellten verschiedene Teams von Xiaomi ein Trio großer Sprachmodelle und ein mit selbst entwickelter KI ausgerüstetes E-Auto vor.
Ich nenne es einen stillen Hinterhalt, nicht weil wir es so geplant haben, sondern weil der Wechsel vom Chat- zum Agenten-Paradigma so schnell erfolgte, dass wir es selbst kaum glauben konnten.
Dann stellte sich der Firmengründer Lei Jun auf eine Bühne und kündigte Investitionen in KI von 60 Milliarden Yuan (rund 7,5 Milliarden Euro) innerhalb der kommenden drei Jahre an.
Xiaomi sei damit auf dem Weg zu einem „führenden Unternehmen im Bereich physischer KI mit eigenen KI-, Betriebssystem- und Chipfähigkeiten“, schrieben Analysten der Investment-Bank Goldman Sachs um Timothy Zhao.
Hier bietet sich eine ganz kurze Definition der Begriffe an. „Physical AI“, also physische KI, wird im Englischen so gut wie gleichbedeutend mit „embodied AI“, also verkörperter KI benutzt. Es ist aber der etwas weitere Begriff von beiden und meint alle KI, die mit der physischen Welt interagiert, sei es in Robotern, Fahrzeugen, Drohnen oder IoT-Geräten.
Mit „embodied AI“ ist gemeint, dass die KI in einem Körper steckt, der sich eigenständig in der Welt bewegen und handeln kann. Ein humanoider Roboter ist das Paradebeispiel. Ein Temperatursensor im Smart Home eher nicht. Da der Ausdruck „verkörperxte KI“ im Deutschen gebräuchlicher ist und die feine Unterscheidung wenig bekannt, ist in diesem Artikel durchgängig von „verkörperter KI“ die Rede.
Xiaomi ist ein Misch-Konzern, der als Smartphone-Hersteller begonnen hat, dann in Haushaltsgeräte und das Internet der Dinge expandierte und seit 2024 auch E-Autos baut und damit auf dem hart umkämpften chinesischen Automarkt sehr erfolgreich ist.
Und jetzt entwickelt Xiaomi also auch eigene KI-Basismodelle mit dem Markennamen „MiMo“. Damit verfügt das Unternehmen über etwas, das weder reine Softwareunternehmen wie OpenAI noch reine Autohersteller haben: ein Ökosystem aus Hunderten Millionen physischer Geräte, in die hauseigene KI-Modelle integriert werden können, die nicht nur rechnen oder in der Cloud Inferenzen aller Art ausführen können, sondern in der realen Umgebung steuern, navigieren und mit Menschen interagieren können.
Seine KI-Modelle hatte Xiaomi im Geheimen vorbereitet. Ein mysteriöser Prototyp war aufgetaucht und hatte für Rätselraten gesorgt, aber die Ankündigung eines Trios eigener großer KI-Modelle auf der jährlichen Tech-Konferenz von Xiaomi kam am 19. März für die überwiegende Mehrheit der Analysten völlig überraschend.
Xiaomi stellte die KI-Modelle MiMo-V2-Pro, MiMo-V2-Omni und MiMo-V2-TTS vor. Das Flaggschiff MiMo-V2-Pro verfügt über mehr als eine Milliarde Parameter und ein Kontextfenster von bis zu einer Million Token. Es rangiert auf der Rangliste von „Artificial Analysis“ weltweit auf Platz acht und übertrifft damit Grok von xAI. MiMo-V2-Pro habe bereits mehr als 1,5 Billionen Tokens verarbeitet, berichtete Reuters.
Der zweite Teil dieses „Hinterhalts“ rund um die KI war die zweite Generation der elektrischen Limousine Xiaomi SU7, die Lei Jun am Abend des 19. März in Peking vorstellte. Die Fahrassistenz des neuen E-Autos basiert auf einem selbst entwickelten KI-Modell, das Angaben seines Herstellers zufolge die Grenzen des datengetriebenen Imitationslernens sprenge.
Die neue XLA-Architektur verfüge über „situatives Verständnis“, sei zu „probabilistischen Schlussfolgerungen fähig“ und könne so „in bislang unbekannten komplexen Szenarien eigenständig Strategien ableiten“, berichtete das chinesische Autoportal Gasgoo.
Dieses Upgrade in den Xiaomi-Autos verbinde erstmals Fahrerassistenz mit verkörperter Robotik, schrieb Gasgoo unter Berufung auf Unternehmenssprecher. Durch multimodale Eingaben und die Integration des MiMo-Embodied-Modells verstehe das System komplexe Verkehrssituationen besser und sei besser für Longtail-Szenarien gerüstet.
Daraus resultierten sowohl menschenähnlichere Entscheidungen als auch eine Reihe neuer Funktionen, die für Menschen nützlich sein sollen.
So könne das mit dem neuen Kognitionsmodell aufgerüstete Fahrassistenzsystem HAD von Xiaomi jetzt etwa in Tiefgaragen von Einkaufszentren selbständig jene freien Plätze finden, die dem bevorzugten Aufzug des Fahrers am nächsten liegen, ließ Xiaomi verlauten. Der Fahrer kann sich nach einem Sprachkommando einfach dorthin navigieren lassen und der SU7 parkt selbstständig ein. Mehr als 3.000 Einkaufszentren sind bereits angebunden.
Lei Jun erklärte, Xiaomis KI-Entwicklung sei deutlich schneller geworden als ursprünglich geplant. "Im Bereich KI werden unsere F&E- und Kapitalinvestitionen in diesem Jahr 16 Milliarden Yuan (rund 2 Milliarden Euro) überschreiten", sagte er.
Dann kündigte Lei Jun als dritten Paukenschlag an, dass seine Firma in den nächsten drei Jahren mehr als 60 Milliarden Yuan (rund 7,5 Milliarden Euro) in KI investieren werde. Der Aktienkurs des Unternehmens fuhr Achterbahn, während die Beobachter noch rätselten, wie das alles zusammenpasst und zu bewerten sei.
Die drei Entwicklungsstränge Haushaltsgeräte, Auto und KI-Modelle will Xiaomi für den Ausbau eines Ökosystems nutzen, das Lei Jun „Mensch-Auto-Haus“ nennt. Ein KI-Agent kann vom Cockpit des Autos aus über 50 verschiedene Systemfunktionen ausführen, vom Verfassen von Nachrichten über die Kalenderverwaltung bis zur Steuerung von IoT-Geräten daheim. Das Fahrzeug wird zum ersten Endgerät verkörperter Intelligenz, das vernetzte Zuhause zum zweiten.
Kein westliches Technologieunternehmen hat heute einen vergleichbaren, mehrstufigen Technologie-Stack. Tesla baut Autos und trainiert Modelle für das Fahren, baut auch humanoide Roboter, hat aber kein breites Ökosystem von Staubsaugern, Klimaanlagen oder Smartphones. OpenAI und Anthropic wiederum bauen leistungsfähige Modelle, aber keine eigene Hardware. Xiaomi tanzt auf beiden Festen der verkörperten KI und auf ihrer Hochzeit.
In der Woche, in der Xiaomis KI-Initiative bekannt wurde, lagen chinesische KI-Modelle zum dritten Mal in Folge vor ihren US-amerikanischen Wettbewerbern, was die globale Nutzung betrifft. Unter den neun meistgenutzten Modellen auf der Plattform OpenRouter kamen fünf aus China (siehe dazu auch den Deep Dive dieser Woche).
"Wir leben in einem völlig neuen Zeitalter. Sowohl Einzelpersonen als auch Unternehmen müssen KI nutzen", sagte Xiaomi-Gründer Lei Jun.
