Oppo hat mit X-OmniClaw einen Open-Source-KI-Agenten entwickelt, der auf Android-Geräten läuft und Aufgaben direkt auf dem Smartphone ausführt – ohne die Daten in die Cloud zu schicken. Das System kombiniert Kamera, Mikrofon und Display, um als kontextbewusster Assistent zu fungieren, der echte Apps steuern kann.
Die meisten mobilen KI-Systeme verarbeiten Anfragen auf Cloud-Servern, wo virtuelle Kopien des Geräts laufen. Das bedeutet: Echte Fotos, lokale Dateien und die physische Kamera sind für die KI unerreichbar. X-OmniClaw dreht diesen Ansatz um und führt die zentrale Logik direkt auf dem Gerät aus. Nur für komplexe Denkprozesse wird ein Cloud-basiertes Sprachmodell hinzugezogen – ähnlich wie beim Automotor, der das Spritbudget sparsam nutzt.
Das System basiert auf drei Säulen: Omni Perception erfasst, was die Kamera, der Bildschirm und das Mikrofon aufnehmen. Omni Action steuert Apps und führt Aufgaben aus. Omni Memory speichert Kontextinformationen über mehrere Sessions hinweg und erstellt aus der Fotogalerie ein semantisches Gedächtnis mit strukturierten Notizen über Objekte und Ereignisse.
Ein besonderes Feature ist die Behavior-Cloning-Funktion: Nutzer können einen Navigationspfad einmalig aufzeichnen, den der Agent später automatisch über Android-Deeplinks nachvollziehen kann. Das erspart wiederholte Multi-Step-Navigation in Apps und macht X-OmniClaw zu einem echten Produktivitätsassistenten statt nur einem Chatbot.