글로벌 주요 AI 벤치마크 고도화 2026: 평가 기준이 어떻게 바뀌나 날짜: 4월 07, 2026 생성형 AI 평가 AI 벤치마크 AI 에이전트 BrowseComp FrontierMath GPQA Humanitys Last Exam MMLU-Pro MMMU SWE-bench +