Oppo hat mit X-OmniClaw ein Open-Source-KI-System entwickelt, das direkt auf Android-Geräten läuft und nur bei komplexen Aufgaben die Cloud nutzt. Das System kombiniert Kamera, Mikrofon und Bildschirm zu einem kontextbewussten Assistenten, der echte Aufgaben in echten Apps ausführt – ohne virtuelle Kopie des Geräts.
X-OmniClaw unterscheidet sich grundlegend von bisherigen mobilen KI-Systemen. Während die meisten Anwendungen auf Cloud-Servern mit virtuellen Android-Kopien arbeiten, führt Oppos Framework die KI-Logik direkt auf dem physischen Gerät aus. Dies ermöglicht Zugriff auf die echte Kamera, lokale Fotos und Dateien – ohne Umweg über entfernte Server.
Das System basiert auf drei Säulen: Omni Perception erfasst alles, was das Smartphone wahrnehmen kann – Kamerabilder, Bildschirminhalte und Sprachbefehle. Omni Action ermöglicht dem Agenten, echte Aufgaben in Apps auszuführen, etwa eine Produktsuche in einem Shop-App. Omni Memory baut einen kontinuierlichen Kontext auf und erstellt aus der Fotogalerie strukturierte Notizen über Objekte und Ereignisse. So funktioniert der Agent wie ein durchgehender Assistent, nicht nur als einzelner Chatbot.
Das Architektur-Prinzip funktioniert wie bei einem Auto: Das Smartphone ist das Fahrzeug, X-OmniClaw der Motor – und Cloud-basierte Sprachmodelle liefern nur dann „Treibstoff", wenn komplexe Denkaufgaben nötig sind. Alles andere bleibt lokal auf dem Gerät.