Physical AI: Sony Project Ace schlägt Profis im TT

Künstliche Intelligenz hat in digitalen Domänen wie Schach, Go oder Videospielen längst übermenschliche Leistungen erzielt. Der Sprung in die physische Welt blieb jedoch eine der größten Herausforderungen der Robotik. Mit Project Ace hat Sony AI diesen Sprung geschafft: Ein autonomer Tischtennisroboter, der unter offiziellen Wettkampfbedingungen professionelle Spieler besiegt.

Was ist Physical AI?

Physical AI beschreibt KI-Systeme, die in der realen Welt wahrnehmen, entscheiden und handeln – in Echtzeit und unter physischen Bedingungen. Anders als rein digitale KI müssen Physical-AI-Systeme mit Unvorhersehbarkeit, Geschwindigkeit und physischen Kräften umgehen. Das erfordert die Verschmelzung von fortschrittlicher Sensorik, maschinellem Lernen und Präzisionsrobotik.

Der Begriff grenzt sich bewusst von „Embodied AI" ab, das häufig auf simulierte Umgebungen beschränkt bleibt. Physical AI operiert ausschließlich in der realen Welt und muss dabei mit Latenz, Reibung, Luftwiderstand und der Unberechenbarkeit menschlicher Gegner umgehen. Die Anforderungen an Zuverlässigkeit und Sicherheit sind dabei ungleich höher als in rein virtuellen Szenarien.

Von Gran Turismo Sophy zu Project Ace

Sony AI hat sich systematisch der Physical AI genähert. Der erste Meilenstein war Gran Turismo Sophy – ein KI-Agent, der in der PlayStation-Rennsimulation übermenschliches Niveau erreichte und 2022 in Nature publiziert wurde. Sophy bewies, dass Reinforcement Learning in hochdynamischen Wettbewerbssituationen funktioniert, wenn auch zunächst nur in einer Simulation.

Project Ace überträgt exakt diese Methodik in die physische Welt. Der entscheidende Unterschied: Während Sophy perfekte Informationen aus dem Spiel-Engine erhielt, muss Ace seine gesamte Wahrnehmung aus Kameradaten in Echtzeit rekonstruieren – bei Ballgeschwindigkeiten von über 100 km/h und Reaktionszeiten von wenigen Millisekunden.

Das Sensorsystem im Detail

Die Wahrnehmungspipeline von Ace besteht aus zwei komplementären Kamerasystemen:

Neun APS-Kameras (Active Pixel Sensor): Diese konventionellen Hochgeschwindigkeitskameras liefern präzise 3D-Positionsdaten des Balls durch Triangulation. Die Kameras arbeiten bei extrem hohen Bildraten, um die Flugbahn des Balls lückenlos zu erfassen.
Drei EVS-Kameras (Event-Based Vision Systems): Eventbasierte Kameras registrieren nur Helligkeitsänderungen auf Pixelebene und erreichen damit eine zeitliche Auflösung im Mikrosekundenbereich. Dadurch können sie den Spin des Balls messen – ein kritischer Parameter, der die Flugbahn nach dem Aufprall entscheidend beeinflusst.

Die Kombination beider Systeme erlaubt es Ace, sowohl Position als auch Rotation des Balls gleichzeitig zu erfassen – eine Fähigkeit, die selbst erfahrene menschliche Spieler nur intuitiv und ungenau besitzen. Die Spin-Erkennung erreicht eine Genauigkeit bei Drehgeschwindigkeiten von bis zu 450 rad/s, was rund 4.300 Umdrehungen pro Minute entspricht.

Reinforcement Learning ohne Modell

Ace verwendet modellfreies Reinforcement Learning – das bedeutet, der Roboter lernt nicht aus einem vordefinierten physikalischen Modell des Spiels, sondern ausschließlich aus Erfahrung. Im Trainingsverfahren durchläuft die KI Millionen simulierter Ballwechsel und optimiert dabei ihre Strategie durch Trial-and-Error.

Dieser Ansatz hat einen entscheidenden Vorteil: Ace kann sich dynamisch an neue Spielsituationen anpassen, die in keinem Modell vorhergesehen wurden. Während eines Matches analysiert das System kontinuierlich die Spielweise des Gegners und passt Schlagauswahl, Platzierung und Timing entsprechend an.

Besonders bemerkenswert ist die Sim-to-Real-Übertragung: Die im Simulator erlernten Strategien werden direkt auf den physischen Roboter übertragen. Die Diskrepanz zwischen simulierter und realer Physik – das sogenannte „Sim-to-Real-Gap" – wird durch Domain Randomization und robuste Policy-Architekturen minimiert. Ace kann dadurch Schläge ausführen, die nie explizit in der realen Welt trainiert wurden.

Der Roboter-Arm: Präzision bei Höchstgeschwindigkeit

Die Hardware von Ace ist auf maximale Geschwindigkeit und Präzision ausgelegt. Der Roboterarm verfügt über sechs Freiheitsgrade und kann Beschleunigungen erreichen, die weit über menschliche Fähigkeiten hinausgehen. Die Bewegungsplanung erfolgt in unter 5 Millisekunden – vom Erkennen des Balls bis zur Berechnung des optimalen Schlags.

Ace beherrscht dabei ein breites Repertoire an Schlagtechniken: Topspin, Backspin, Seitenschnitt und flache Schläge werden je nach Spielsituation dynamisch gewählt. Der Roboter kann den Ball mit variablem Spin und präziser Platzierung zurückspielen – Fähigkeiten, die auf Profi-Niveau selten und auf maschinellem Niveau bisher unerreicht waren.

Ergebnisse unter Wettkampfbedingungen

Ace wurde unter offiziellen Regeln der International Table Tennis Federation (ITTF) gegen fünf Elite- und zwei Profispieler getestet. Die Ergebnisse sind beeindruckend:

Drei Siege in fünf Matches gegen Elite-Spieler (Rating über 1.800)
Über 75 % Rückschlagquote bei Spin-Werten bis zu 450 rad/s
16 direkte Punkte nach eigenem Aufschlag – doppelt so viele wie die menschlichen Gegner zusammen
Durchschnittliche Schlaggeschwindigkeit von über 9 m/s mit Spitzenwerten über 12 m/s
In Folgetests im Dezember 2025 und März 2026 besiegte Ace mehrere Profispieler und zeigte höhere Schlaggeschwindigkeiten sowie aggressivere Platzierung

Besonders aufschlussreich war das Verhalten der menschlichen Spieler: Mehrere Profis berichteten, dass sich das Spiel gegen Ace „anders anfühlt" als gegen andere Spieler. Die Konsistenz und Unberechenbarkeit der Roboter-Schläge zwangen die Spieler, ihre gewohnten Strategien aufzugeben und sich in Echtzeit neu zu orientieren.

Warum Tischtennis?

Tischtennis mag auf den ersten Blick wie eine Nischenanwendung wirken, ist aber als Testumgebung für Physical AI ideal. Der Sport vereint extreme Geschwindigkeit (Ballgeschwindigkeiten über 100 km/h), komplexe Physik (Spin, Luftwiderstand, Materialreibung) und strategische Tiefe (Gegneranpassung, Aufschlagvariation) in einem klar definierten Regelwerk. Damit ist Tischtennis ein perfekter Benchmark für die Frage, ob KI-Systeme in dynamischen physischen Umgebungen auf menschlichem Expertenniveau agieren können.

Bedeutung über den Sport hinaus

Die Implikationen reichen weit über Tischtennis hinaus. Peter Stone, Chief Scientist bei Sony AI, betont: „Sobald KI unter diesen Bedingungen auf menschlichem Expertenniveau operieren kann, öffnet das die Tür zu einer völlig neuen Klasse realer Anwendungen."

Denkbare Einsatzfelder umfassen:

Autonome Fertigung: Roboter, die auf unvorhergesehene Situationen in Produktionslinien reagieren können
Chirurgische Assistenz: Präzise, schnelle Eingriffe unter variablen Bedingungen
Sicherheitskritische Umgebungen: Einsatz in Katastrophengebieten, Unterwasser oder im Weltraum
Logistik und Warenlagerung: Dynamisches Greifen und Sortieren heterogener Objekte
Mensch-Roboter-Kollaboration: Roboter, die in Echtzeit auf menschliche Bewegungen reagieren und kooperativ arbeiten

Die Kernleistung von Project Ace – die Integration von Hochgeschwindigkeitswahrnehmung, adaptivem Lernen und Präzisionsmechanik – ist eine Blaupause für jede Anwendung, die physische Intelligenz in dynamischen Umgebungen erfordert.

Ausblick: Die nächste Stufe physischer Intelligenz

Sony AI hat mit Project Ace einen wichtigen Beweis erbracht: Physical AI ist keine Zukunftsvision mehr, sondern technische Realität. Die nächsten Schritte werden zeigen, wie schnell sich die Technologie auf andere physische Domänen übertragen lässt. Die Kombination aus simulationsbasiertem Training und hochpräziser Sensorik bietet einen skalierbaren Ansatz, der über einzelne Anwendungen hinausweist.

Die Forschungsergebnisse wurden auf dem Cover des Fachjournals Nature veröffentlicht. Weitere Details unter ace.ai.sony.

Physical AI: Sony Project Ace schlägt Profispieler im Tischtennis