총 55개 · AI 추월 22개 (40%)
| 분야 | 인간 기록 | AI 기록 | 상태 | 출처 |
|---|---|---|---|---|
| 체스인지 | Magnus Carlsen (Elo 2882) | Stockfish 16 (Elo 3600+)Deep Blue → Stockfish | AI 초월 (1997) | 출처 |
| 바둑인지 | Shin Jinseo (Elo 3820) | AlphaGo/KataGo (Elo 5000+)AlphaGo → KataGo | AI 초월 (2016) | 출처 |
| 이미지 인식지각 | 인간 오류율 ~5% | AI 오류율 ~1.5%ResNet → Vision Transformers | AI 초월 (2015) | 출처 |
| 자연어 이해인지 | SuperGLUE 인간 기준 89.8 | GPT-4 96.3BERT → GPT-4 | AI 초월 (2020) | 출처 |
| 단백질 구조 예측인지 | X-ray 결정학 (수년 소요) | AlphaFold2 (수 시간)AlphaFold2 | AI 초월 (2020) | 출처 |
| 100m 달리기신체 | Usain Bolt 9.58초 | AI 로봇 아직 미달N/A | 인간 우위 | 출처 |
| 수학 올림피아드인지 | IMO 금메달리스트 42점 만점 | AlphaProof/Gemini: 28/42AlphaProof | 인간 우위 | 출처 |
| 마라톤신체 | Kelvin Kiptum 2:00:35 | Boston Dynamics Spot: 불가N/A | 인간 우위 | 출처 |
| 음악 작곡창작 | 인간 작곡가의 감정 표현 | Suno AI / UdioSuno AI | 인간 우위 | 출처 |
| 시각 예술 (그림)창작 | 인간 화가의 독창성 | Midjourney / DALL-E 3Midjourney v5 | AI 초월 (2022) | 출처 |
| 수영 (자유영 100m)신체 | Pan Zhanle 46.40초 | 수중 로봇 : 해당 없음N/A | 인간 우위 | 출처 |
| 코딩 (프로그래밍)인지 | IOI 금메달리스트 | AlphaCode2 / ClaudeAlphaCode2 | 인간 우위 | 출처 |
| 독해력인지 | SQuAD 2.0 인간 기준 89.5 F1 | GPT-4 98.5 F1BERT → GPT-4 | AI 초월 (2019) | 출처 |
| 의료 진단 (영상)인지 | 피부과 전문의 정확도 ~86% | AI 진단 정확도 ~95%CheXNet → Med-PaLM | AI 초월 (2017) | 출처 |
| 번역인지 | 전문 번역가 (BLEU ~33) | GPT-4 / DeepL (BLEU ~40+)DeepL → GPT-4 | AI 초월 (2023) | 출처 |
| 법률 시험인지 | 인간 합격률 ~68% | GPT-4 상위 10% 통과GPT-4 | AI 초월 (2023) | 출처 |
| 수학 (대학 수준)인지 | MIT 학생 평균 ~70% | Claude 3.5 Sonnet ~78%Minerva → Claude / GPT-4o | AI 초월 (2024) | 출처 |
| 과학 지식 (GPQA)인지 | 비전공자 34% / 전공 박사 65% | Claude 3.5 Opus 60%+GPT-4o / Claude | 인간 우위 | 출처 |
| 날씨 예측인지 | ECMWF 수치 모델 (40년 표준) | GraphCast (10일 예측)GraphCast (DeepMind) | AI 초월 (2023) | 출처 |
| 신약 개발인지 | 평균 10~15년, $26억 비용 | AlphaFold + AI: 기간 단축 가능AlphaFold2 / Isomorphic Labs | 인간 우위 | 출처 |
| 음성 인식지각 | 인간 오류율 ~5.1% (Switchboard) | Whisper v3 오류율 ~2.5%DeepSpeech → Whisper v3 | AI 초월 (2023) | 출처 |
| 물체 감지지각 | 인간 평균 mAP ~75% | YOLOv9 mAP 55.6% (COCO)YOLO → RT-DETR | 인간 우위 | 출처 |
| 감정 인식지각 | 인간 정확도 ~72% (표정) | AI 정확도 ~65% (표정)Affectiva / Hume AI | 인간 우위 | 출처 |
| 역도 (데드리프트)신체 | Hafthor Björnsson 501kg | Boston Dynamics Atlas: 해당 없음N/A | 인간 우위 | 출처 |
| 프리다이빙신체 | Herbert Nitsch 214m (No-Limit) | 수중 로봇: 11,000m+ 가능Nereus / Limiting Factor | AI 초월 (2012) | 출처 |
| 지구력 (울트라마라톤)신체 | Yiannis Kouros 24시간 303.5km | 로봇: 24시간 연속 주행 불가N/A | 인간 우위 | 출처 |
| 소설 집필창작 | 인간 작가의 서사·감정 깊이 | Claude / GPT-4: 단편 가능, 장편 한계Claude / GPT-4 | 인간 우위 | 출처 |
| 영상 생성창작 | 헐리우드 VFX (수개월 작업) | Sora / Veo 2: 분 단위 생성Sora / Runway / Veo 2 | 인간 우위 | 출처 |
| 게임 전략 (스타크래프트)창작 | 그랜드마스터 Top 0.2% | AlphaStar: 그랜드마스터 도달AlphaStar (DeepMind) | AI 초월 (2019) | 출처 |
| 요리 레시피 창작창작 | 미슐랭 셰프의 창의성 | AI: 조합 가능, 미각 판단 불가Chef Robotics / Sony AI | 인간 우위 | 출처 |
| SWE-bench Verified인지 | 숙련 SWE 엔지니어 (참고치 ~85%) | Claude 4.7 Sonnet ~80%+Claude 4 / GPT-5 / Gemini 3 | 인간 우위 | 출처 |
| GAIA (범용 AI 어시스턴트)인지 | 인간 평가자 92% | 최상위 에이전트 ~75%GPT-5 / Claude 4.7 Agent | 인간 우위 | 출처 |
| OSWorld (컴퓨터 사용)인지 | 인간 사용자 72.4% | Claude 4.7 Computer Use ~42%Claude Computer Use / GPT-5 | 인간 우위 | 출처 |
| WebArena (자율 웹 에이전트)인지 | 인간 78.2% | 최상위 LLM 에이전트 ~50%GPT-5 / Claude 4.7 | 인간 우위 | 출처 |
| Terminal-Bench인지 | 시니어 개발자 ~80% | Claude 4.7 ~45%Claude 4.7 / GPT-5 | 인간 우위 | 출처 |
| ARC-AGI-2 (추상 추론)인지 | 평균 인간 ~60% (연습 시) | 최상위 AI 약 5%GPT-5 / o3 변형 | 인간 우위 | 출처 |
| FrontierMath (연구 수준 수학)인지 | 박사급 수학자 ~25% (수 시간) | o3 / Gemini 3 ~32%o3 / Gemini 3 Deep Think | AI 초월 (2025) | 출처 |
| Humanity's Last Exam (HLE)인지 | 도메인 전문가 90%+ | 최상위 AI ~30%GPT-5 / Claude 4.7 / Gemini 3 | 인간 우위 | 출처 |
| MMLU-Pro (전문 지식)인지 | 도메인 전문가 평균 ~80% | GPT-5 / Claude 4.7 ~88%GPT-4o → GPT-5 | AI 초월 (2024) | 출처 |
| AIME 2025 (수학 경시)인지 | IMO 진출자 ~80% | o3-mini ~87% / Gemini 3 ~95%o1 → o3 → Gemini 3 | AI 초월 (2024) | 출처 |
| 장문 회상 (1M 토큰)인지 | 인간 ~5만 단어 단기 한계 | Gemini 3 / Claude 4.7: 1M+Gemini 1.5 → Gemini 3 / Claude 4.7 | AI 초월 (2024) | 출처 |
| 포커 (텍사스 홀덤)인지 | 세계 챔피언 다니엘 네그리누 | Pluribus (CMU + Meta)Libratus → Pluribus | AI 초월 (2019) | 출처 |
| 디플로머시 (외교 게임)인지 | 인간 평균 (협상 + 전략) | CICERO (Meta AI 2022)CICERO | AI 초월 (2022) | 출처 |
| 자율주행 (안전성)신체 | 인간 운전자 평균 사고율 | Waymo: 사고율 -85% (운영 구역)Waymo / Cruise / Tesla FSD | AI 초월 (2024) | 출처 |
| 휴머노이드 보행신체 | 인간 자연 보행 (균형 + 적응) | Atlas / Optimus / Figure 02Atlas (BD) / Optimus / Figure 02 | 인간 우위 | 출처 |
| 로봇 손재주 (매듭/신발끈)신체 | 5세 아동도 ~10초 만에 가능 | 최상위 로봇: 분 단위, 실패율 높음Tesla Bot / Dexterous Hand 시도 | 인간 우위 | 출처 |
| 후각 (와인 소믈리에)지각 | Master Sommelier 약 270명 (전 세계) | e-Nose 센서: 단일 화합물 한정Aryballe / Roboscientist | 인간 우위 | 출처 |
| 미각 (Gustation)지각 | 인간 미뢰 ~10,000개 | AI 센서: 5가지 기본 맛 한정IBM Hypertaste | 인간 우위 | 출처 |
| 시 작성 (현대시)창작 | 노벨 문학상 수상자급 | Claude / GPT-5: 일부 평가 통과Claude 4.7 / GPT-5 | 인간 우위 | 출처 |
| 즉흥 연주 (재즈)창작 | Charlie Parker / Herbie Hancock | MusicLM / Suno: 작곡 가능, 실시간 한계MusicLM / Suno / Udio | 인간 우위 | 출처 |
| 발레 / 현대무용신체 | Misty Copeland / Sylvie Guillem | 휴머노이드 로봇: 단순 동작 한정Atlas Dance / Optimus 시연 | 인간 우위 | 출처 |
| 농담 / 스탠드업 코미디창작 | 데이브 샤펠 / 빌 버 / 박나래 | AI: 형식 모방 가능, 타이밍 한계GPT-5 / Claude | 인간 우위 | 출처 |
| 마음이론 (Theory of Mind)인지 | 5세 이상 아동 ~85% 통과 | GPT-5 / Claude 4.7 ~75%GPT-5 / Claude 4.7 | 인간 우위 | 출처 |
| 심리 상담 / 공감인지 | 임상 심리상담사 (자격증 평균 7년 수련) | Woebot / Wysa / Character.AIWoebot / Wysa | 인간 우위 | 출처 |
| 위기 직관 (Crisis Intuition)인지 | 체슬리 설런버거 (허드슨 강 착륙) | AI 비행 시스템: 정상 운영 중심자율 비행 시스템 (한정) | 인간 우위 | 출처 |