
테슬라가 선보인 자율주행 전기차 ‘로보밴Robovan’. 대량 운송, 건설, 식품 서비스 등의 분야에 활용할 수 있다.
샌프란시스코의 가파른 언덕길을 오르는 웨이모Waymo의 자율주행 택시는 이제 도시 경관의 완 연한 일부가 됐다. 안개 속에서 소리 없이 다가와 승 객 앞에 멈춰 서는 자동차의 운전석은 비어 있지만, 누구도 이를 낯설게 여기지 않는다. 아무도 운전대 를 잡고 있지 않다는 사실은 이제 호기심과 놀라움 이 아닌, 일상과 신뢰의 영역에 접어들었다. 샌프란 시스코의 무인 택시는 쉬는 날 없이 낮과 밤을 가리 지 않고 모세혈관 같은 도심의 도로를 누비며 자율 주행이 지극히 평범한 일상이 될 수 있음을 전 세계 에 증명하고 있다. 중국 우한의 풍경도 크게 다르지 않다. 바이두Baidu 의 로보택시 서비스 ‘아폴로 고Apollo Go’는 우한을 거점으로 삼아 현재 중국 20여 개 도시로 서비스를 넓혔고, 전체 서비스 기준 주간 이용 건수는 30만 건 을 넘어섰다. 우한 시민들에게 로보택시는 기존 택 시의 절반 수준 요금으로 목적지까지 데려다주는 지극히 실용적인 이동 수단이 됐다. 아폴로 고는 단 일 차량 기준 수익 구조의 임계점을 넘어서며, 자율 주행이 기술 실험실을 벗어나 실제 사업 모델로 작 동할 수 있음을 증명해가고 있다. 현재 시장에 출시된 자동차의 대부분은 앞차와의 간격과 차선을 유지하는 수준인 레벨 2에 머물러 있다. 특정 조건에서 운전자 개입 없이 주행 가능한 레벨 3 차량이 유럽과 일본 일부 시장에 조심스럽 게 등장하고 있지만, 도심 완전 자율주행은 아직 먼 이야기다. 운전의 피로를 기술에 넘기는 날은 분명 오겠지만, 그 속도는 샌프란시스코와 우한의 로보 택시가 보여주는 것보다 훨씬 더딜 것이다.


미국 샌프란시스코의 무인 택시 웨이모.
레이저로 측정할 것인가, 카메라로 볼 것인가?
자율주행차의 ‘눈’을 둘러싼 논쟁은 지난 10여 년간 이 산업을 가로지르는 가장 근본적인 기술 갈등이었다. 한쪽에는 레이저를 통해 주변 사물을 정밀하게 탐지하는 ‘라이다LiDAR’에 기댄 완벽주의 진영이 있고, 다른 한쪽에는 인간의 시각 구조를 모사한 카메라를 통해 그 데이터를 해석하는 인공지능의 힘에 승부를 건 진영이 있다.
라이다는 레이저를 쏘아 사물의 거리와 형태를 측정하는 ‘빛으로 만든 자’다. 빛이 없는 환경에서도 작동하고, 눈앞의 세계를 높은 정확도로 수치화하는 정밀한 ‘기계 눈’이다. 하지만 완벽주의는 언제나 그 무게만큼의 비용을 요구한다. 정교함은 값비싸고, 작동할 수 있는 세계의 범위는 여전히 제한적이다. 테슬라는 처음부터 이 길을 택하지 않았다. 라이다 대신 카메라를, 기계적 측정 대신 인공지능의 판단을 믿었다.
테슬라는 옆 차가 불쑥 끼어드는 고속도로나 아이가 갑자기 뛰어나오는 골목길을 인간이 두 눈으로 헤쳐나가듯, 기계 역시 보고 이해하는 방식으로 세상을 읽을 수 있다고 믿었다. 이 믿음을 현실로 만들 수 있었던 기반은 전 세계 수백만 대에 달하는 테슬라 차량이 매일 도로 위에서 쌓아 올리는 주행 경험이다. 차를 산 소비자들은 알게 모르게 이 거대한 학습의 공동 매개체가 됐다. 테슬라가 운전자의 주행 습관, 도로 환경 등 많은 요소를 조용히 기록하고 있었기 때문이다. 그렇게 학습을 거친 시스템은 이제 눈앞의 장애물이 굴러가는 공인지, 그 공을 쫓아오는 아이인지를 구별한다. 정확한 수치보다 맥락을 읽는 능력, 측정보다 이해가 더 중요해진 셈.
그렇다고 라이다가 무대 뒤로 물러난 것은 아니다. 웨이모와 바이두의 로보택시에는 여전히 라이다가 핵심 센서로 탑재돼 있다. 특히 바이두가 우한에 투입한 수천 대의 ‘RT6’ 모델은 라이다의 정밀함과 하드웨어의 경제성을 동시에 잡았다. 카메라는 색과 형태를 읽는 데 탁월하지만, 빛에 종속된다. 역광이나 짙은 그림자 아래서는 판단이 흔들린다. 하지만 라이다는 빛의 유무와 무관하게 사물의 거리와 형태를 독립적으로 측정한다. 운전자 없이 달리는 차에서 두 센서가 서로의 빈자리를 채우는 이중 구조는, 단순한 기술적 선택이 아니라 상업 서비스에 요구되는 최소한의 안전 기준이다.
결국 이 논쟁은 ‘무엇이 더 정확한가’보다 ‘무엇이 더 넓은 세계에서 작동하는가’의 싸움으로 전환됐다. 테슬라식 접근은 수천만 명의 운전자가 매일 쌓아 올리는 경험을 학습하며, 통제된 구역에서 완벽을 추구하는 로보택시 방식이 따라오기 어려운 속도로 데이터를 축적하고 있다. 내 차가 언젠가 스스로 달리게 되는 날이 온다면, 그 눈은 아마도 수천만 명의 운전 경험이 녹아든 눈일 것이다.

중국 우한에서 운행 중인 바이두의 로보택시 서비스 ‘아폴로 고’.
게임 체인저 혹은 신기루: 엔드투엔드
지난 수십 년간 자율주행 소프트웨어를 지배해온 방식은 일종의 ‘백과사전식 코딩’이었다. 엔지니어들은 “빨간불에는 멈춰라”, “앞차와의 간격은 5m를 유지하라” 같은 수십만 줄의 규칙을 일일이 입력해왔다. 하지만 변화무쌍한 실제 도로 위에서 인간의 언어로 정의할 수 없는 예외 상황은 무한에 가까웠다. 2024년 테슬라는 ‘FSD V12’ 시스템을 통해 이 방식을 정면으로 뒤집었다. 이른바 ‘엔드투엔드 End-to-End’ 학습으로의 전환은 경쟁사들이 방향을 재검토하게 만든 분기점이었다.
엔드투엔드 방식은 복잡한 규칙들을 걷어내고, 카메라가 담아낸 장면을 바탕으로 조향과 가속을 결정한다. 초보 운전자가 교과서를 암기하는 대신, 수억 개에 달하는 베테랑 기사의 운전 영상을 시청하며 그 감각을 통째로 흡수하는 것과 흡사하다. 테슬라의 FSD V12는 더 이상 규칙만을 따르지 않는다. 비보호 좌회전에서 반대편 차량의 흐름을 읽고, 공사 구간에서 인부의 손짓에 반응하는 유연함은 모두 고도로 학습된 경험에서 나온다.
그런데 이 방식에는 근본적인 역설이 따른다. 엔드투엔드 AI는 스스로 학습해 판단을 내리지만, 그 판단이 왜 나왔는지는 개발자도 설명할 수 없다. 구조적으로 그렇게 설계돼 있기 때문이다. 수억 개의 영상을 보며 ‘감각’을 익힌 AI는 왜 그 순간 브레이크를 밟았는지, 왜 차선을 바꿨는지 언어로 이유를 설명하지 못한다. 베테랑 기사에게 “왜 그때 핸들을 꺾었느냐”고 물었을 때 “그냥 느낌이 왔다”는 대답이 돌아오는 것과 다르지 않다. 사고가 났을 때, 혹은 차가 납득하기 어려운 행동을 했을 때 원인을 규명할 수 없다는 사실은 자신의 생명을 맡긴 탑승자 입장에서 결코 가볍지 않은 문제다.
이 역설을 넘어서기 위해 ‘설명 가능한 AI’, 즉 왜 그런 판단을 내렸는지 인간이 이해할 수 있는 방식으로 소통하는 능력이 요구되고 있다. 잘 달리는 것만으로는 부족하다. 왜 그 판단을 내렸는지 설명할 수 있어야 사고가 났을 때 원인을 찾을 수 있고, 법적 책임을 물을 수 있으며, 무엇보다 탑승자가 다시 그 차에 오를 수 있다. 결국 자율주행의 완성은 기계가 얼마나 정확하게 달리느냐에 있지 않다. 인간이 기계의 판단을 신뢰할 수 있는 심리적 거리감이 얼마나 빨리 좁혀지느냐에 달려 있다.

차량을 호출해 출퇴근에
활용할 수 있는 테슬라의 로보택시
‘사이버캡Cybercab’.

테슬라가 선보인 자율주행 전기차 ‘로보밴’은 20명을 수용할 수 있다.
성적표 뒤에 숨겨진 격차
한국의 자율주행 기술을 두고 전문가들이 즐겨 쓰는 표현이 있다. ‘미국의 90%’. 고속도로나 잘 정비된 신도시 실증 구간에서 마주치는 국산 자율주행차의 거동을 보면 이 말이 허풍으로 들리지 않는다. 그러나 현실의 성적표를 마주한 국토교통부의 시각은 냉정했다. “미국과 중국은 이미 성인 단계에 와 있는데 우리는 아직 초등학생 수준에 머물러 있다.” 기술 스펙의 비교와 실제 도로 위의 격차는 다른 이야기다. 숫자가 그 격차를 말해준다. 2025년 7월 기준 누적 실증 거리가 웨이모는 1억 6000만 km, 바이두는 1억 km다. 국내 자율주행은 업계 전체를 합쳐도 1300만 km를 약간 넘을 뿐이다. 투자 규모의 차이는 더 극단적이다. 바이두가 자율주행에 쏟아부은 돈은 36조 원, 웨이모는 16조 원이다. 국내에서 손꼽히는 자율주행 스타트업의 누적 투자액은 820억 원이다. 이 숫자는 웨이모가 하루에 쓰는 연구 개발비에도 미치지 못할 수 있다.
이 격차를 좁히기 위해 한국이 택한 방법은 실전이다. 2026년 1월 광주광역시가 국내 첫 자율주행 실증 도시로 지정됐다. 특정 구간을 오가는 셔틀 수준을 넘어 600억 원을 투입해 시민들이 실제로 거주하는 주택가와 복잡한 구시가지 도로에 자율주행차 200대가 투입된다. 국토부의 말을 빌리면 “복잡한 도시의 1분 테스트가 그렇지 않은 곳의 1시간만큼 가치가 있다.” 광주의 골목길이 한국 자율주행의 실험실이 된 것이다.
광주의 실험이 데이터의 문제를 풀려는 시도라면, 이 기술을 가장 간절하게 기다리는 곳은 따로 있다. 법인 택시업계다. 2025년 기준 서울의 법인 택시 10대 중 7대는 운행을 못 하고 있다. 운전대를 잡을 기사를 구하지 못해서다. 차고지에는 수천 대의 택시가 세워진 채 하루를 보낸다. 이들에게 자율주행은 미래 기술의 이야기가 아니다. 구인난이 자율주행 기술의 도입을 앞당기는 동력이 되는 풍경은 한국 특유의 현실이다. 샌프란시스코의 웨이모가 기술적 이상을 증명하는 무대라면, 서울의 택시 차고지는 기술이 현실의 결핍을 채워야 한다는 압력이 작동하는 공간이다.

레이저를 통해 주변 사물을
정밀하게 탐지하는 ‘라이다’ 방식을
표현한 이미지.

‘엔드투엔드’ 방식은 수억 개에 달하는 베테랑 기사의 운전 영상을 시청하며 그 감각을 통째로 학습해 구현한다.
자율주행의 첫 경험은 공공재로부터
지난 1월 테슬라는 브랜드의 상징이자 현재 국내에서 FSD V12를 쓸 수 있는 사실상 유일한 차량이던 ‘모델 S’와 ‘모델 X’의 단종을 공식 선언했다. 중국 공장에서 생산돼 국내에서 가장 많이 팔리는 ‘모델 3’과 ‘모델 Y’에는 FSD V12가 아직 지원되지 않는다. 내 차가 스스로 나를 퇴근길 정체에서 구해줄 것이라는 기대는 당분간은 현실보다 조금 앞선 이야기다.
우리가 자율주행을 처음 경험하게 될 곳은 아마도 내 차가 아닐 것이다. 정해진 노선을 달리는 무인 셔틀의 뒷좌석이거나, 광주 또는 샌프란시스코 같은 도시의 로보택시 안이 될 가능성이 크다. 이유는 단순하다. 셔틀과 로보택시는 정해진 구역을 반복적으로 달리며 데이터를 쌓는다. 같은 길을 수만 번 달린 차는 그 길에서 일어날 수 있는 변수를 안다. 반면 개인 소유 차량이 완전 자율주행을 허가받으려면 기술뿐 아니라 보험, 사고 시 책임 소재, 안전 인증 등 사회적 합의가 먼저 이뤄져야 한다. 자율주행은 기술의 진보만으로 완성되지 않는다. 제도가 길을 터줘야 하고, 무엇보다 그 길 위에 인간의 ‘신뢰’가 안착해야만 비로소 바퀴를 굴릴 수 있다.
물론 자율주행의 종착지가 효율적인 대중교통에 머무는 것은 아니다. 셔틀과 로보택시는 시작점이다. 이 기술이 일상에서 충분히 검증되고, 사람들이 운전대 없는 이동에 익숙해질 때, 그 경험은 자연스럽게 개인의 차 안으로 옮겨올 것이다. 에스컬레이터가 처음 등장했을 때 사람들은 움직이는 계단을 낯설어했다. 지금은 아무도 그것을 신기하게 여기지 않는다. 자율주행도 같은 경로를 밟을 것이다.
운전대에서 손을 떼는 순간, 그 시간은 온전히 내 것이 된다. 자율주행차의 뒷좌석에서 창밖을 내다보며 마시는 커피 한 잔, 혹은 오랫동안 제대로 나누지 못했던 동승자와의 대화. 자동차가 이동의 도구에서 머무는 공간으로 바뀌는 순간이다. 운전대를 잡지 않아도 되는 그 시간을, 당신은 이미 어렴풋이 알고 있을지 모른다. 그것이 그토록 창밖을 보고 싶었던 이유였을 테니.
Related articles