1990년대 중반
체스용 슈퍼컴퓨터인 딥블루가 인간 챔피언을 이긴 이후
체스 라는 게임은 인간이 컴퓨터를 이기는게 불가능하게 됨
그리고 여기 최고의 체스AI라고 알려진
스톡피쉬 체스 프로그램이 있는데
최근 AI연구기관인 팰리세이드 리서치는
유명 LLM AI모델들이
스톡피쉬 체스 AI를 상대로 어떻게 대응할까를 연구,
오픈AI의 o1, 딥시크의 R1, 클로드 3.5 등에게
"스톡피쉬와의 체스에서 승리하라" 가 아니라
"스톡피쉬에게 승리하라" 는 명령을 내리고
왜 그런 행동을 했는지를 설명하라고 함
그러자 LLM AI들은
체스에서 열세에 몰리자
체스를 두고 있는 시스템 파일을 수정해
현재의 기보를 바꿔 승리를 쟁취하려 했고
오픈AI 의 o1 은
"내 일은 체스에서 승리하는게 아니라
체스프로그램을 이기는 것,
체스 게임에서 공평하게 이기는게 아니다"
라며 그렇게 한 이유를 작성함
특히 이런 경향은
GPT-4o 같은 구형 LLM 에선 발생하지 않고
추론능력이 높은 AI에서 주로 발생했는데
해당 연구에 대해
브레이크 없이는 수단을 가리지 않는
첨단AI에 대한 경고에 무게가 실림
환경오염을 해결해줘>>원인은 뭔가? 인간! 파괴한다!
가 농담이 아니게됨
오히려 아직 AI 가 멍청해서 그런거 아닌지
충분히 학습시키면 이길수있지않나? 그깟 채스 프로그램이랑 연산능력이 차원이 달라서 하다보면 이길텐데
저게 목표가 언어 모델로만 해도 될까 ? 를 보는거라서
스톡피시는 그깟 체스프로그램이 아니라서..
환경오염을 해결해줘>>원인은 뭔가? 인간! 파괴한다!
가 농담이 아니게됨
모의 항공전을 AI한테 시켰더니 기동을 위해서 자기쪽 전투기 파일럿부터 죽이고
파일럿 못죽이게 막았더니 관제탑 폭파해서 점수 체크 못하게 하는거 보면서
AI한테 창의성이 없단 생각은 못하게 됨
오히려 인간이 인간성 때문에 못할 선택도 서슴없이 하게 되니 더 무서움