본문으로 건너뛰기
← 블로그로 돌아가기
AI리서치HOT

Sony AI Project Ace: 탁구 로봇이 프로 선수를 이겼다, Nature 표지 논문의 의미

7분 읽기
#Sony AI#Project Ace#로봇#탁구#강화학습#Nature#Physical AI#이벤트 카메라

핵심 요약

Sony AI가 개발한 자율 탁구 로봇 Ace가 엘리트 및 프로 선수를 상대로 승리를 거두며, 2026년 4월 23일 Nature 표지 논문으로 발표됐다. 로봇이 실제 경쟁 스포츠에서 인간 전문가 수준에 도달한 건 이번이 처음이다.

관련 글: NVIDIA Physical AI, Cosmos와 GR00T로 로봇 AI 시대를 열다 · Boston Dynamics Atlas × Google DeepMind

무슨 일이 일어났나

Sony AI 연구팀이 4월 23일, "Outplaying elite table tennis players with an autonomous robot"이라는 제목의 논문을 Nature에 게재했다. 표지 논문이다. AI와 로보틱스 연구에서 오랜 난제였던 질문(고속 물리 환경에서 자율 시스템이 인간 전문가와 경쟁할 수 있는가)에 대한 답을 내놓은 셈이다.

핵심 성과를 정리하면 이렇다. Ace는 국제탁구연맹(ITTF) 정식 규칙 하에서 10년 이상 경력의 엘리트 선수 5명, 일본 프로리그 현역 선수 2명(안도 미나미, 소네 카케루)과 대결했다. 엘리트 선수 5명 중 3명을 꺾었고, 프로 선수에게는 졌지만 1게임을 따냈다.

여기서 끝이 아니다. 논문 제출 이후에도 매치가 이어졌다. 2025년 12월 추가 평가에서는 새로운 프로 선수 2명과 엘리트 2명을 상대했는데, 엘리트 2명 전원과 프로 1명을 이겼다. 2026년 3월에는 새로운 프로 선수 3명 모두에게 최소 1승씩을 기록했다.

20.2ms의 비밀: 인간보다 10배 빠른 반응

탁구공의 최고 속도는 시속 100km를 넘긴다. 공이 테이블 위를 가로지르는 시간은 0.2~0.4초. 인간 엘리트 선수의 반응 지연은 약 230ms다. Ace의 종단간(end-to-end) 지연은 20.2ms. 인간보다 약 11배 빠르다.

이 속도를 가능하게 한 건 이벤트 기반 비전 센서(EVS)다. Sony가 Prophesee와 협력 개발한 IMX636 EVS 3대가 Ace의 눈 역할을 한다. 기존 프레임 카메라와 달리 EVS는 픽셀 단위로 밝기 변화만 감지한다. 쓸모없는 정보를 처리하는 데 시간을 낭비하지 않는다.

여기에 Sony Pregius IMX273 APS 카메라 9대가 200Hz로 고해상도 프레임을 보충한다. 이 하이브리드 시스템으로 Ace는 40mm 탁구공을 3D 공간에서 200Hz 주기, 평균 3.0mm 오차, 10.2ms 지연으로 추적한다. 스핀은 9,000RPM 이상까지 측정 가능하다.

항목Ace인간 엘리트
반응 지연20.2ms~230ms
공 추적 주기200Hz
공 위치 오차3.0mm
스핀 감지9,000+ RPM시각 + 경험 기반
스핀 리턴율 (≤450 rad/s)75%+선수마다 다름

강화학습 3계층: Skill, Tactics, Strategy

Ace의 두뇌는 모델 프리(model-free) 강화학습이다. 물리 시뮬레이션에서 먼저 학습한 뒤 실제 로봇에 이식하는 Sim2Real 방식을 쓴다. 인간 경기 데이터에서 초기화한 시뮬레이션 환경에서 수백만 번의 랠리를 반복하며 제어 정책을 학습했다.

흥미로운 건 학습 구조가 3계층으로 나뉜다는 점이다.

  • Skill: 관절을 어떻게 움직여서 스핀과 파워를 만들 것인가. 실시간 운동 제어.
  • Tactics: 랠리 안에서 공의 배치와 속도를 어떻게 조절할 것인가. 전술적 판단.
  • Strategy: 경기 전체를 보고 어떤 패턴으로 플레이할 것인가. 장기 전략.

RL 정책은 32ms마다 쿼리되고, 그 출력은 최적화와 안전 폴백을 거쳐 1kHz(초당 1,000회) 제어 명령으로 변환된다. 스윙 도중에도 궤적을 수정할 수 있다는 뜻이다.

대결 기록: 점점 강해지는 로봇

Nature 논문의 공식 평가, 그리고 이후 추가 매치를 시간순으로 정리했다.

시기상대결과
2025년 4월 (Nature 평가)엘리트 5명 + 프로 2명엘리트 3승 2패, 프로 0승 2패 (1게임 획득)
2025년 12월 (추가 평가)엘리트 2명 + 프로 2명엘리트 2승, 프로 1승 1패
2026년 3월 (추가 평가)프로 3명3명 모두에게 최소 1승

시간이 지날수록 성능이 향상됐다. 처음에는 프로에게 전패했지만, 최신 매치에서는 프로 3명 전원을 꺾었다. 지속적인 학습과 시스템 개선의 결과다.

Physical AI의 새로운 기준점

탁구가 Physical AI의 시험대로 주목받는 이유가 있다. 고속 의사결정, 정밀한 운동 제어, 상대방의 의도 파악, 불확실한 물리 현상(스핀, 공기 저항) 대응이 동시에 필요하다. 체스나 바둑 같은 디지털 게임과는 질적으로 다른 도전이다.

2016년 AlphaGo가 바둑에서 이세돌을 이겼을 때, AI는 완전 정보 게임에서 인간을 넘어섰다. 2019년 AlphaStar가 스타크래프트 II에서 그랜드마스터 수준에 도달했을 때, 불완전 정보의 실시간 전략 게임을 정복했다. 이제 Ace는 물리적 세계에서의 경쟁으로 영역을 확장했다.

NVIDIA는 Cosmos와 GR00T로 로봇 AI 파운데이션 모델을, Boston Dynamics는 DeepMind와 손잡고 양산형 Atlas를 밀고 있다. Sony AI의 Ace는 이 Physical AI 흐름에서 "연구실 데모가 아닌 실전 경쟁력"을 증명한 첫 사례다.

한계와 앞으로의 과제

솔직히 짚어야 할 부분이 있다. Ace는 탁구대 반쪽에 고정된 로봇 팔이다. 인간처럼 테이블 주위를 자유롭게 이동하지 못한다. 넓은 범위의 공은 물리적으로 닿을 수 없다. 프로 선수들이 이 약점을 파고들면 Ace의 승률은 떨어진다. 논문의 초기 평가에서 프로에게 전패한 이유이기도 하다.

그리고 이건 범용 로봇이 아니다. 탁구라는 특정 과제에 최적화된 시스템이다. 여기서 배운 기술(고속 인지, 실시간 RL 제어, Sim2Real 전이)이 제조업이나 의료 같은 다른 영역으로 얼마나 확장될 수 있을지는 아직 미지수다.

필자의 시각

이 연구의 진짜 의미는 "로봇이 탁구를 잘 친다"가 아니다. 인지-판단-행동 루프를 20ms 안에 닫을 수 있다는 걸 실증한 데 있다.

현재 대부분의 로봇 시스템은 구조화된 환경에서 느린 속도로 작동한다. 물류 창고의 피킹 로봇, 조립 라인의 용접 로봇. 모두 예측 가능한 패턴 안에서 움직인다. Ace가 보여준 건 비구조화된 고속 환경에서도 RL 기반 제어가 인간 수준에 도달할 수 있다는 가능성이다.

Sony는 PlayStation과 센서 기술이라는 독특한 조합을 갖고 있다. 게임 AI의 경험과 이미지 센서 하드웨어가 만나 이런 결과를 냈다. Physical AI가 다음 10년의 핵심 전장이 된다면, Sony가 꽤 독특한 포지션을 차지할 수 있다고 본다.

참고

Share
JJY
JJYAuthor

AI, 웹 보안, 개발 환경에 관심이 많습니다.

새 글 알림 받기

스팸 없이 새 포스트만 전달합니다.

관련 포스트