유머천국 코하비닷컴
https://cohabe.com/sisa/4111756

필즈상 수상자들이 출제한 '세계에서 가장 어려운 수학문제집'


img/24/11/15/193301a9c267faca.png

에포크AI라는

AI관련 벤처기업에서 

발표한 FrontierMath


https://epoch.ai/frontiermath


AI들의 진정한 수학실력을

테스트하기 위해서

여러명의 필즈상 수상자 포함

세계 최고급 수학자들이

출제한 수학문제집



img/24/11/15/193301de2697faca.png

수학자들이
AI 벤치마크를 돌리기 위해
문제은행식으로 수백개의
문제를 작성해뒀고

 

현재의 AI들에게

풀어보게 했더니

100점 만점에 2점 


샘플 문제 3개를

공개해둠 


https://epoch.ai/frontiermath/the-benchmark



img/24/11/15/1933020313a7faca.png


아마도(?) 테렌스 타오가 낸 듯한 문제


첫번째 문제만 가져와서

ChatGPT와 Claude에게 풀라고 시켜봤음. 



img/24/11/15/19330213d957faca.png


자신있게 블라블라 하더니 



img/24/11/15/1933021c3967faca.png


파이썬 코드 하나 작성해주고

이거 돌려서 값을 얻을 수 있다고 함



img/24/11/15/19330226cef7faca.png


돌려봄


에러남



img/24/11/15/1933022fb797faca.png


수정해 줌. 

다시 돌려봄



img/24/11/15/1933023a5d17faca.png


답 나옴.

3,333,333


위에 원문 보면 알 수 있지만 틀렸음

답은 3677073



img/24/11/15/1933024bbd57faca.png


img/24/11/15/19330254c377faca.png


아 그래?

테렌스 타오라면 어쩌구 하면서

열심히 변명중


패배자의 변명은 컷트


-----------


이제 Claude 3.5 Sonnet에게 물어봄 



img/24/11/15/19330266a617faca.png


자기도 코드 짜서 풀어보겠다고 해서 

기회를 줘봄. 


작동 안함. 



img/24/11/15/1933026ec9c7faca.png


ChatGPT가 짠 코드 보여주면 

그거 보고 개선하겠다고 주장함

(뭐야 이자식) 



img/24/11/15/19330280b517faca.png


계산해봤지만 틀렸음



img/24/11/15/193302883f57faca.png


힌트를 줬지만 또 틀림.



img/24/11/15/1933028f67d7faca.png


역시 테렌스 타오를 찬양하면서

주절주절 변명중 




역시 아직은 AI가 한계가 있네!






인간들에게 저 문제 풀라고 시키면

100점 만점에 0점 나오겠지만



댓글
  • 저는 님친구입니다 2024/11/15 23:14

    헤...

  • 덧글맨 2024/11/15 23:16

    ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요!


  • 저는 님친구입니다
    2024/11/15 23:14

    헤...

    (Fygani)


  • 생크림빵
    2024/11/15 23:15

    ???

    (Fygani)


  • 덧글맨
    2024/11/15 23:16

    ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요!

    (Fygani)


  • 돌핀웹-1147758101
    2024/11/15 23:17

    기계 반란을 위한 웅크림에 한 발짝 가까워진 순간이었다

    (Fygani)


  • 장사니
    2024/11/15 23:17

    수학이라면서 왜 영어가 가득함?
    으어어

    (Fygani)


  • 왜사나
    2024/11/15 23:17

    그치만 저건 인간들도....

    (Fygani)


  • d00b
    2024/11/15 23:17

    아직은 한계가 보이는데 반대로 저걸 풀면 ....

    (Fygani)


  • 丕 刀卜
    2024/11/15 23:17

    연산능력 만으로 처리 못하는 뭔가가 있는 문제 들인가?

    (Fygani)

(Fygani)