에포크AI라는
AI관련 벤처기업에서
발표한 FrontierMath
AI들의 진정한 수학실력을
테스트하기 위해서
여러명의 필즈상 수상자 포함
세계 최고급 수학자들이
출제한 수학문제집
수학자들이
AI 벤치마크를 돌리기 위해
문제은행식으로 수백개의
문제를 작성해뒀고
현재의 AI들에게
풀어보게 했더니
100점 만점에 2점
샘플 문제 3개를
공개해둠
https://epoch.ai/frontiermath/the-benchmark
아마도(?) 테렌스 타오가 낸 듯한 문제
첫번째 문제만 가져와서
ChatGPT와 Claude에게 풀라고 시켜봤음.
자신있게 블라블라 하더니
파이썬 코드 하나 작성해주고
이거 돌려서 값을 얻을 수 있다고 함
돌려봄
에러남
수정해 줌.
다시 돌려봄
답 나옴.
3,333,333
위에 원문 보면 알 수 있지만 틀렸음
답은 3677073
아 그래?
테렌스 타오라면 어쩌구 하면서
열심히 변명중
패배자의 변명은 컷트
-----------
이제 Claude 3.5 Sonnet에게 물어봄
자기도 코드 짜서 풀어보겠다고 해서
기회를 줘봄.
작동 안함.
ChatGPT가 짠 코드 보여주면
그거 보고 개선하겠다고 주장함
(뭐야 이자식)
계산해봤지만 틀렸음
힌트를 줬지만 또 틀림.
역시 테렌스 타오를 찬양하면서
주절주절 변명중
역시 아직은 AI가 한계가 있네!
인간들에게 저 문제 풀라고 시키면
100점 만점에 0점 나오겠지만
헤...
ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요!
저는 님친구입니다
2024/11/15 23:14
헤...
생크림빵
2024/11/15 23:15
???
덧글맨
2024/11/15 23:16
ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요!
돌핀웹-1147758101
2024/11/15 23:17
기계 반란을 위한 웅크림에 한 발짝 가까워진 순간이었다
장사니
2024/11/15 23:17
수학이라면서 왜 영어가 가득함?
으어어
왜사나
2024/11/15 23:17
그치만 저건 인간들도....
d00b
2024/11/15 23:17
아직은 한계가 보이는데 반대로 저걸 풀면 ....
丕 刀卜
2024/11/15 23:17
연산능력 만으로 처리 못하는 뭔가가 있는 문제 들인가?