55 total · 22 AI-surpassed (40%)
| Domain | Human | AI | Status | Source |
|---|---|---|---|---|
| ChessCognitive | Magnus Carlsen (Elo 2882) | Stockfish 16 (Elo 3600+)Deep Blue → Stockfish | AI Surpassed (1997) | Source |
| GoCognitive | Shin Jinseo (Elo 3820) | AlphaGo/KataGo (Elo 5000+)AlphaGo → KataGo | AI Surpassed (2016) | Source |
| Image RecognitionPerception | 인간 오류율 ~5% | AI 오류율 ~1.5%ResNet → Vision Transformers | AI Surpassed (2015) | Source |
| Natural Language UnderstandingCognitive | SuperGLUE 인간 기준 89.8 | GPT-4 96.3BERT → GPT-4 | AI Surpassed (2020) | Source |
| Protein Structure PredictionCognitive | X-ray 결정학 (수년 소요) | AlphaFold2 (수 시간)AlphaFold2 | AI Surpassed (2020) | Source |
| 100m SprintPhysical | Usain Bolt 9.58초 | AI 로봇 아직 미달N/A | Human leads | Source |
| Math OlympiadCognitive | IMO 금메달리스트 42점 만점 | AlphaProof/Gemini: 28/42AlphaProof | Human leads | Source |
| MarathonPhysical | Kelvin Kiptum 2:00:35 | Boston Dynamics Spot: 불가N/A | Human leads | Source |
| Music CompositionCreative | 인간 작곡가의 감정 표현 | Suno AI / UdioSuno AI | Human leads | Source |
| Visual Art (Painting)Creative | 인간 화가의 독창성 | Midjourney / DALL-E 3Midjourney v5 | AI Surpassed (2022) | Source |
| Swimming (100m Freestyle)Physical | Pan Zhanle 46.40초 | 수중 로봇 : 해당 없음N/A | Human leads | Source |
| Coding (Programming)Cognitive | IOI 금메달리스트 | AlphaCode2 / ClaudeAlphaCode2 | Human leads | Source |
| Reading ComprehensionCognitive | SQuAD 2.0 인간 기준 89.5 F1 | GPT-4 98.5 F1BERT → GPT-4 | AI Surpassed (2019) | Source |
| Medical Imaging DiagnosisCognitive | 피부과 전문의 정확도 ~86% | AI 진단 정확도 ~95%CheXNet → Med-PaLM | AI Surpassed (2017) | Source |
| TranslationCognitive | 전문 번역가 (BLEU ~33) | GPT-4 / DeepL (BLEU ~40+)DeepL → GPT-4 | AI Surpassed (2023) | Source |
| Bar Exam (Law)Cognitive | 인간 합격률 ~68% | GPT-4 상위 10% 통과GPT-4 | AI Surpassed (2023) | Source |
| College-level MathCognitive | MIT 학생 평균 ~70% | Claude 3.5 Sonnet ~78%Minerva → Claude / GPT-4o | AI Surpassed (2024) | Source |
| Graduate-level Science (GPQA)Cognitive | 비전공자 34% / 전공 박사 65% | Claude 3.5 Opus 60%+GPT-4o / Claude | Human leads | Source |
| Weather ForecastingCognitive | ECMWF 수치 모델 (40년 표준) | GraphCast (10일 예측)GraphCast (DeepMind) | AI Surpassed (2023) | Source |
| Drug DiscoveryCognitive | 평균 10~15년, $26억 비용 | AlphaFold + AI: 기간 단축 가능AlphaFold2 / Isomorphic Labs | Human leads | Source |
| Speech RecognitionPerception | 인간 오류율 ~5.1% (Switchboard) | Whisper v3 오류율 ~2.5%DeepSpeech → Whisper v3 | AI Surpassed (2023) | Source |
| Object DetectionPerception | 인간 평균 mAP ~75% | YOLOv9 mAP 55.6% (COCO)YOLO → RT-DETR | Human leads | Source |
| Emotion RecognitionPerception | 인간 정확도 ~72% (표정) | AI 정확도 ~65% (표정)Affectiva / Hume AI | Human leads | Source |
| DeadliftPhysical | Hafthor Björnsson 501kg | Boston Dynamics Atlas: 해당 없음N/A | Human leads | Source |
| FreedivingPhysical | Herbert Nitsch 214m (No-Limit) | 수중 로봇: 11,000m+ 가능Nereus / Limiting Factor | AI Surpassed (2012) | Source |
| Ultramarathon EndurancePhysical | Yiannis Kouros 24시간 303.5km | 로봇: 24시간 연속 주행 불가N/A | Human leads | Source |
| Novel WritingCreative | 인간 작가의 서사·감정 깊이 | Claude / GPT-4: 단편 가능, 장편 한계Claude / GPT-4 | Human leads | Source |
| Video GenerationCreative | 헐리우드 VFX (수개월 작업) | Sora / Veo 2: 분 단위 생성Sora / Runway / Veo 2 | Human leads | Source |
| Game Strategy (StarCraft)Creative | 그랜드마스터 Top 0.2% | AlphaStar: 그랜드마스터 도달AlphaStar (DeepMind) | AI Surpassed (2019) | Source |
| Culinary Recipe CreationCreative | 미슐랭 셰프의 창의성 | AI: 조합 가능, 미각 판단 불가Chef Robotics / Sony AI | Human leads | Source |
| SWE-bench VerifiedCognitive | 숙련 SWE 엔지니어 (참고치 ~85%) | Claude 4.7 Sonnet ~80%+Claude 4 / GPT-5 / Gemini 3 | Human leads | Source |
| GAIA (General AI Assistant)Cognitive | 인간 평가자 92% | 최상위 에이전트 ~75%GPT-5 / Claude 4.7 Agent | Human leads | Source |
| OSWorld (Computer Use)Cognitive | 인간 사용자 72.4% | Claude 4.7 Computer Use ~42%Claude Computer Use / GPT-5 | Human leads | Source |
| WebArena (Autonomous Web Agent)Cognitive | 인간 78.2% | 최상위 LLM 에이전트 ~50%GPT-5 / Claude 4.7 | Human leads | Source |
| Terminal-BenchCognitive | 시니어 개발자 ~80% | Claude 4.7 ~45%Claude 4.7 / GPT-5 | Human leads | Source |
| ARC-AGI-2 (Abstract Reasoning)Cognitive | 평균 인간 ~60% (연습 시) | 최상위 AI 약 5%GPT-5 / o3 변형 | Human leads | Source |
| FrontierMath (Research-level Math)Cognitive | 박사급 수학자 ~25% (수 시간) | o3 / Gemini 3 ~32%o3 / Gemini 3 Deep Think | AI Surpassed (2025) | Source |
| Humanity's Last ExamCognitive | 도메인 전문가 90%+ | 최상위 AI ~30%GPT-5 / Claude 4.7 / Gemini 3 | Human leads | Source |
| MMLU-ProCognitive | 도메인 전문가 평균 ~80% | GPT-5 / Claude 4.7 ~88%GPT-4o → GPT-5 | AI Surpassed (2024) | Source |
| AIME 2025 (Math Competition)Cognitive | IMO 진출자 ~80% | o3-mini ~87% / Gemini 3 ~95%o1 → o3 → Gemini 3 | AI Surpassed (2024) | Source |
| Long-context Recall (1M tokens)Cognitive | 인간 ~5만 단어 단기 한계 | Gemini 3 / Claude 4.7: 1M+Gemini 1.5 → Gemini 3 / Claude 4.7 | AI Surpassed (2024) | Source |
| Poker (Texas Hold'em)Cognitive | 세계 챔피언 다니엘 네그리누 | Pluribus (CMU + Meta)Libratus → Pluribus | AI Surpassed (2019) | Source |
| DiplomacyCognitive | 인간 평균 (협상 + 전략) | CICERO (Meta AI 2022)CICERO | AI Surpassed (2022) | Source |
| Self-driving SafetyPhysical | 인간 운전자 평균 사고율 | Waymo: 사고율 -85% (운영 구역)Waymo / Cruise / Tesla FSD | AI Surpassed (2024) | Source |
| Humanoid Bipedal LocomotionPhysical | 인간 자연 보행 (균형 + 적응) | Atlas / Optimus / Figure 02Atlas (BD) / Optimus / Figure 02 | Human leads | Source |
| Dexterous ManipulationPhysical | 5세 아동도 ~10초 만에 가능 | 최상위 로봇: 분 단위, 실패율 높음Tesla Bot / Dexterous Hand 시도 | Human leads | Source |
| Olfaction (Wine Sommelier)Perception | Master Sommelier 약 270명 (전 세계) | e-Nose 센서: 단일 화합물 한정Aryballe / Roboscientist | Human leads | Source |
| Taste (Gustation)Perception | 인간 미뢰 ~10,000개 | AI 센서: 5가지 기본 맛 한정IBM Hypertaste | Human leads | Source |
| Poetry (Modern)Creative | 노벨 문학상 수상자급 | Claude / GPT-5: 일부 평가 통과Claude 4.7 / GPT-5 | Human leads | Source |
| Musical Improvisation (Jazz)Creative | Charlie Parker / Herbie Hancock | MusicLM / Suno: 작곡 가능, 실시간 한계MusicLM / Suno / Udio | Human leads | Source |
| Ballet / Contemporary DancePhysical | Misty Copeland / Sylvie Guillem | 휴머노이드 로봇: 단순 동작 한정Atlas Dance / Optimus 시연 | Human leads | Source |
| Stand-up Comedy / HumorCreative | 데이브 샤펠 / 빌 버 / 박나래 | AI: 형식 모방 가능, 타이밍 한계GPT-5 / Claude | Human leads | Source |
| Theory of MindCognitive | 5세 이상 아동 ~85% 통과 | GPT-5 / Claude 4.7 ~75%GPT-5 / Claude 4.7 | Human leads | Source |
| Therapy / EmpathyCognitive | 임상 심리상담사 (자격증 평균 7년 수련) | Woebot / Wysa / Character.AIWoebot / Wysa | Human leads | Source |
| Crisis IntuitionCognitive | 체슬리 설런버거 (허드슨 강 착륙) | AI 비행 시스템: 정상 운영 중심자율 비행 시스템 (한정) | Human leads | Source |