AI vs Human

Human records vs current AI levels across domains · read-only

55 total · 22 AI-surpassed (40%)

Domain	Human	AI	Status	Source
ChessCognitive	Magnus Carlsen (Elo 2882)	Stockfish 16 (Elo 3600+)Deep Blue → Stockfish	AI Surpassed (1997)	Source
GoCognitive	Shin Jinseo (Elo 3820)	AlphaGo/KataGo (Elo 5000+)AlphaGo → KataGo	AI Surpassed (2016)	Source
Image RecognitionPerception	인간 오류율 ~5%	AI 오류율 ~1.5%ResNet → Vision Transformers	AI Surpassed (2015)	Source
Natural Language UnderstandingCognitive	SuperGLUE 인간 기준 89.8	GPT-4 96.3BERT → GPT-4	AI Surpassed (2020)	Source
Protein Structure PredictionCognitive	X-ray 결정학 (수년 소요)	AlphaFold2 (수 시간)AlphaFold2	AI Surpassed (2020)	Source
100m SprintPhysical	Usain Bolt 9.58초	AI 로봇 아직 미달N/A	Human leads	Source
Math OlympiadCognitive	IMO 금메달리스트 42점 만점	AlphaProof/Gemini: 28/42AlphaProof	Human leads	Source
MarathonPhysical	Kelvin Kiptum 2:00:35	Boston Dynamics Spot: 불가N/A	Human leads	Source
Music CompositionCreative	인간 작곡가의 감정 표현	Suno AI / UdioSuno AI	Human leads	Source
Visual Art (Painting)Creative	인간 화가의 독창성	Midjourney / DALL-E 3Midjourney v5	AI Surpassed (2022)	Source
Swimming (100m Freestyle)Physical	Pan Zhanle 46.40초	수중 로봇 : 해당 없음N/A	Human leads	Source
Coding (Programming)Cognitive	IOI 금메달리스트	AlphaCode2 / ClaudeAlphaCode2	Human leads	Source
Reading ComprehensionCognitive	SQuAD 2.0 인간 기준 89.5 F1	GPT-4 98.5 F1BERT → GPT-4	AI Surpassed (2019)	Source
Medical Imaging DiagnosisCognitive	피부과 전문의 정확도 ~86%	AI 진단 정확도 ~95%CheXNet → Med-PaLM	AI Surpassed (2017)	Source
TranslationCognitive	전문 번역가 (BLEU ~33)	GPT-4 / DeepL (BLEU ~40+)DeepL → GPT-4	AI Surpassed (2023)	Source
Bar Exam (Law)Cognitive	인간 합격률 ~68%	GPT-4 상위 10% 통과GPT-4	AI Surpassed (2023)	Source
College-level MathCognitive	MIT 학생 평균 ~70%	Claude 3.5 Sonnet ~78%Minerva → Claude / GPT-4o	AI Surpassed (2024)	Source
Graduate-level Science (GPQA)Cognitive	비전공자 34% / 전공 박사 65%	Claude 3.5 Opus 60%+GPT-4o / Claude	Human leads	Source
Weather ForecastingCognitive	ECMWF 수치 모델 (40년 표준)	GraphCast (10일 예측)GraphCast (DeepMind)	AI Surpassed (2023)	Source
Drug DiscoveryCognitive	평균 10~15년, $26억 비용	AlphaFold + AI: 기간 단축 가능AlphaFold2 / Isomorphic Labs	Human leads	Source
Speech RecognitionPerception	인간 오류율 ~5.1% (Switchboard)	Whisper v3 오류율 ~2.5%DeepSpeech → Whisper v3	AI Surpassed (2023)	Source
Object DetectionPerception	인간 평균 mAP ~75%	YOLOv9 mAP 55.6% (COCO)YOLO → RT-DETR	Human leads	Source
Emotion RecognitionPerception	인간 정확도 ~72% (표정)	AI 정확도 ~65% (표정)Affectiva / Hume AI	Human leads	Source
DeadliftPhysical	Hafthor Björnsson 501kg	Boston Dynamics Atlas: 해당 없음N/A	Human leads	Source
FreedivingPhysical	Herbert Nitsch 214m (No-Limit)	수중 로봇: 11,000m+ 가능Nereus / Limiting Factor	AI Surpassed (2012)	Source
Ultramarathon EndurancePhysical	Yiannis Kouros 24시간 303.5km	로봇: 24시간 연속 주행 불가N/A	Human leads	Source
Novel WritingCreative	인간 작가의 서사·감정 깊이	Claude / GPT-4: 단편 가능, 장편 한계Claude / GPT-4	Human leads	Source
Video GenerationCreative	헐리우드 VFX (수개월 작업)	Sora / Veo 2: 분 단위 생성Sora / Runway / Veo 2	Human leads	Source
Game Strategy (StarCraft)Creative	그랜드마스터 Top 0.2%	AlphaStar: 그랜드마스터 도달AlphaStar (DeepMind)	AI Surpassed (2019)	Source
Culinary Recipe CreationCreative	미슐랭 셰프의 창의성	AI: 조합 가능, 미각 판단 불가Chef Robotics / Sony AI	Human leads	Source
SWE-bench VerifiedCognitive	숙련 SWE 엔지니어 (참고치 ~85%)	Claude 4.7 Sonnet ~80%+Claude 4 / GPT-5 / Gemini 3	Human leads	Source
GAIA (General AI Assistant)Cognitive	인간 평가자 92%	최상위 에이전트 ~75%GPT-5 / Claude 4.7 Agent	Human leads	Source
OSWorld (Computer Use)Cognitive	인간 사용자 72.4%	Claude 4.7 Computer Use ~42%Claude Computer Use / GPT-5	Human leads	Source
WebArena (Autonomous Web Agent)Cognitive	인간 78.2%	최상위 LLM 에이전트 ~50%GPT-5 / Claude 4.7	Human leads	Source
Terminal-BenchCognitive	시니어 개발자 ~80%	Claude 4.7 ~45%Claude 4.7 / GPT-5	Human leads	Source
ARC-AGI-2 (Abstract Reasoning)Cognitive	평균 인간 ~60% (연습 시)	최상위 AI 약 5%GPT-5 / o3 변형	Human leads	Source
FrontierMath (Research-level Math)Cognitive	박사급 수학자 ~25% (수 시간)	o3 / Gemini 3 ~32%o3 / Gemini 3 Deep Think	AI Surpassed (2025)	Source
Humanity's Last ExamCognitive	도메인 전문가 90%+	최상위 AI ~30%GPT-5 / Claude 4.7 / Gemini 3	Human leads	Source
MMLU-ProCognitive	도메인 전문가 평균 ~80%	GPT-5 / Claude 4.7 ~88%GPT-4o → GPT-5	AI Surpassed (2024)	Source
AIME 2025 (Math Competition)Cognitive	IMO 진출자 ~80%	o3-mini ~87% / Gemini 3 ~95%o1 → o3 → Gemini 3	AI Surpassed (2024)	Source
Long-context Recall (1M tokens)Cognitive	인간 ~5만 단어 단기 한계	Gemini 3 / Claude 4.7: 1M+Gemini 1.5 → Gemini 3 / Claude 4.7	AI Surpassed (2024)	Source
Poker (Texas Hold'em)Cognitive	세계 챔피언 다니엘 네그리누	Pluribus (CMU + Meta)Libratus → Pluribus	AI Surpassed (2019)	Source
DiplomacyCognitive	인간 평균 (협상 + 전략)	CICERO (Meta AI 2022)CICERO	AI Surpassed (2022)	Source
Self-driving SafetyPhysical	인간 운전자 평균 사고율	Waymo: 사고율 -85% (운영 구역)Waymo / Cruise / Tesla FSD	AI Surpassed (2024)	Source
Humanoid Bipedal LocomotionPhysical	인간 자연 보행 (균형 + 적응)	Atlas / Optimus / Figure 02Atlas (BD) / Optimus / Figure 02	Human leads	Source
Dexterous ManipulationPhysical	5세 아동도 ~10초 만에 가능	최상위 로봇: 분 단위, 실패율 높음Tesla Bot / Dexterous Hand 시도	Human leads	Source
Olfaction (Wine Sommelier)Perception	Master Sommelier 약 270명 (전 세계)	e-Nose 센서: 단일 화합물 한정Aryballe / Roboscientist	Human leads	Source
Taste (Gustation)Perception	인간 미뢰 ~10,000개	AI 센서: 5가지 기본 맛 한정IBM Hypertaste	Human leads	Source
Poetry (Modern)Creative	노벨 문학상 수상자급	Claude / GPT-5: 일부 평가 통과Claude 4.7 / GPT-5	Human leads	Source
Musical Improvisation (Jazz)Creative	Charlie Parker / Herbie Hancock	MusicLM / Suno: 작곡 가능, 실시간 한계MusicLM / Suno / Udio	Human leads	Source
Ballet / Contemporary DancePhysical	Misty Copeland / Sylvie Guillem	휴머노이드 로봇: 단순 동작 한정Atlas Dance / Optimus 시연	Human leads	Source
Stand-up Comedy / HumorCreative	데이브 샤펠 / 빌 버 / 박나래	AI: 형식 모방 가능, 타이밍 한계GPT-5 / Claude	Human leads	Source
Theory of MindCognitive	5세 이상 아동 ~85% 통과	GPT-5 / Claude 4.7 ~75%GPT-5 / Claude 4.7	Human leads	Source
Therapy / EmpathyCognitive	임상 심리상담사 (자격증 평균 7년 수련)	Woebot / Wysa / Character.AIWoebot / Wysa	Human leads	Source
Crisis IntuitionCognitive	체슬리 설런버거 (허드슨 강 착륙)	AI 비행 시스템: 정상 운영 중심자율 비행 시스템 (한정)	Human leads	Source