[AI 팟캐스트] 존 카맥의 AI 미래 비전 - 로봇, 비디오 게임, AGI를 향한 새로운 도전

     

     

     

    👤 존 카맥, 게임의 전설에서 AGI의 개척자로

    • id Software 공동 설립자: Doom, Quake 개발
    • Oculus 최고기술책임자(CTO): 현대 VR의 기초 설계
    • Armadillo Aerospace 창립자: 우주 비행 기술 연구
    • 현재: Keen Technologies 창립자, AGI 연구 전념

    “AI는 지금 누구나 도전할 수 있는 가장 흥미로운 과학이다.”


    1️⃣ LLM 그 이상을 향한 문제의식

    카맥은 GPT와 같은 대규모 언어 모델의 발전에 감탄하면서도,
    **“LLM은 인간처럼 세상을 배우지 않는다”**는 점을 지적합니다.

    • LLM의 한계:
      • 개·고양이 구분, 유아 수준의 추론조차 어려움
      • 모든 인간 지식을 "믹서기에 갈아 넣는" 방식
      • 학습 효율, 환경 적응력, 일반성 부족

    “LLM이 모든 해답은 아니다. AGI는 더 근본적인 학습 능력을 필요로 한다.”


    2️⃣ Atari 게임, AI 연구의 이상적 실험장

    카맥은 Keen Technologies에서 Atari 게임을 중심으로 AI 학습을 실험합니다.

    • 이유 1: 다양성과 비편향성
      • 100개 이상의 게임: 다양한 학습 시나리오 제공
      • 연구자를 위한 설계가 아닌, 인간을 위한 게임 → 공정한 벤치마크
    • 이유 2: 적절한 단순함
      • Minecraft보다 간결한 구조
      • 복잡성 최소화 → 핵심 문제에 집중 가능
    • Atari 100k 벤치마크
      • 단 2시간(10만 프레임) 내 학습 요구
      • 초인적 성능보다 빠르고 효율적인 학습이 관건

    3️⃣ 현실 세계와의 상호작용 실험

    카맥은 시뮬레이션을 넘어 로봇과 실제 물리 환경에서도 실험을 확장 중입니다.

    • 로봇의 어려움:
      • 조이스틱을 조작하는 AI 로봇 → 섬세한 동작, 대기 시간, 센서 한계 등
      • 조작 타이밍 문제, 조작기 내구도 문제까지 등장
    • Latency(지연 시간)의 문제:
      • 현실은 환경이 기다려주지 않음
      • VR에서는 20ms 지연이 표준이지만, 실제 실험에서는 180ms 이상
    • 보상 인식의 어려움:
      • 점수를 직접 인식해야 하는 현실 AI
      • 환경 조건(조명, 화면 흔들림 등)으로 인해 오차 발생

    4️⃣ AGI를 향한 강화 학습(RL)의 핵심 과제

    카맥이 지목한 현재 강화학습의 6대 문제:

    🔄 순차적 다중 작업 학습

    • 게임 A 학습 후 게임 B 학습 시, A를 망각하는 문제
    • 인간은 학습 내용을 누적하지만, AI는 쉽게 잊음

    🧠 지속적 학습의 손상

    • 모델 업데이트 시 전체 응답이 변경됨 → 안정적 누적학습 불가

    🚪 전이 학습의 부재

    • 10개의 게임을 마스터해도 11번째 게임에는 오히려 학습 방해 발생
    • 부정적인 전이(negative transfer) 현상

    🪙 희소한 보상 문제

    • 실제 환경에서는 즉각적인 보상이 없음
    • 탐색 기반 행동은 강화학습에서 학습이 매우 어려움
    • 인간은 내재적 동기와 호기심을 통해 탐험함

    🧭 탐색 전략의 비효율성

    • 엡실론-그리디 방식(무작위 행동)은 인간의 전략과 동떨어짐

    🎮 복잡한 행동 공간 문제

    • Atari는 18개 행동, 실제 게임패드는 수백만 가지 조합
    • 행동 공간 압축/일반화가 필요

    5️⃣ 새로운 벤치마크 제안: 더 나은 AGI 실험을 위해

    카맥은 공정하고 실용적인 벤치마크 설계 원칙을 제안합니다:

    • 순차 학습 중심: 여러 게임을 순서대로 학습 → 마지막 게임에서 평가
    • 극단적으로 단순한 인터페이스: 관찰 → 보상 → 행동으로만 구성된 구조
    • 평가 단계 없음: 훈련 마지막이 평가 → 리셋이나 조작 방지
    • 시드 다양성 확보: 20개 이상의 시드 테스트로 통계적 신뢰 확보
    • 지연 시간 삽입: 현실의 Latency 대응력 실험 가능

    “나쁜 벤치마크라도, 없는 것보단 낫다.”


    ✅ 결론: AGI를 향한 과학적 여정의 시작

    카맥은 AGI를 단순히 언어 처리 능력이 아닌
    **“현실에서 학습하고 적응하는 생명체 같은 존재”**로 보고 있습니다.

    • 현재 LLM의 한계를 뛰어넘는 **‘지능의 근원’**에 대한 과학적 탐구
    • 시뮬레이션과 현실에서 학습, 추론, 실행이 통합된 AI
    • 공동체와 함께 새로운 연구 벤치마크를 만들고 문제를 제대로 측정하려는 시도

    📌 주요 키워드

    #존카맥 #AGI #강화학습 #AtariAI #KeenTechnologies #로봇AI #AI연구 #AI벤치마크 #카맥강연 #AI윤리

    댓글