중국에서 이번에 새로 발표한 DEEPSEEK R1 모델.사실 한국에서는 시진핑 놀리는데나 쓰이기 때문에 뭐 그냥 웃고 넘어가는 분위기지만 생각보다 그리 만만한 놈이 아니다.
사실 성능적으로 보면 이게 미국에서 나온 있는 AI보다 성능적으로 아주 두각을 드러내는건 아니다.하지만 그렇다고 떨어지지도 않음.벤치마크상 지금 GPT-4o~o1 정도의 성능을 보이고 있다는건 성능적으로 선두권에 있다고 볼수 있는거지.
하지만 이놈의 진가는 '싸다'는데 있음.그냥 다 쌈.모델 개발 비용도 싸고 출력 비용도 싸다.이거 개발하는데 꼴랑 80억 들었음.출력 비용도 토큰당 비용이 GPT의 5% 수준임
무엇보다 지금까지 AI 개발은 성능향상에 '스케일링'을 중점적으로 두었음.즉 데이터 규모를 늘리는데 중점은 두었다는거임.문제는 성능향상을 위해 필요한 데이터와 비용이 기하급수적으로 늘어난다는데 있음.
Deekseek는 그럴 돈도 없고 중국 반도체 제재로 고성능 H칩 대량으로 구하기도 힘드니 대신 강화학습으로 방향을 틀었음.강화학습이란 에이전트가 환경과 상호작용하면서 최적의 행동을 학습하는 방법임.간단히 말하면 헛소리하면 벌점주고 맞는 소리하면 점수주는 식으로 데이터셋을 정제화 하는거지.이게 가능한 이유? 그거야 당연히 월 200만원도 안되는 월급받으면서 9-9-6 일하는 박사급 인재가 중국에 썩어넘치니까 가능한거지.미국도 하면 안되냐고? 그게 미국의 미쳐버린 AI 엔지니어들 인건비 때문에...
게다가 이걸 오픈소스로 풀어버림.메타가 그나마 소스 풀고 자기들 ai모델 꽁꽁 숨기는 풍조가 있었는데 이걸 오픈소스로 푸니 반향이 더 큰거지.
실제 OPENAI측도 긴장해서 월 200달러 플랜에서나 쓰게 하겠다는 o3와 o3mini 중에서 o3-mini를 20달러 플러스 구독제에서도 쓰게해주겠다고 발표했으니까.
여튼 성능적으로는 미국이 여전히 AI분야에서 탑을 달릴건 분명함.미국은 조만간 최고 성능일 o3가 공개될거니까.대신 중국은 대신 괜찮은 성능을 엄청나게 싸게 공급한다는 전략을 세우고 있는거 같으니 AI업계가 긴장하는거.
더 무서운건 지속적으로 데이터를 가져가고 싶어하는놈들은 무슨짓이든 할것이라는거
즉 인권이 낮은곳에서 인권을 더 낮추는 요소를 인간을 갈아넣어 저렴한 값으로 만들어냈다는거구나
밀크티조아
2025/01/26 16:28
워메...
RoZeMeLi
2025/01/26 16:28
더 무서운건 지속적으로 데이터를 가져가고 싶어하는놈들은 무슨짓이든 할것이라는거
크리쳐맨
2025/01/26 16:28
난 AI분야 여전히 뭔소리인지 모르겠어
나도 디지털 소외계층이 되는 건가
나래여우🦊
2025/01/26 16:30
즉 인권이 낮은곳에서 인권을 더 낮추는 요소를 인간을 갈아넣어 저렴한 값으로 만들어냈다는거구나
smile-03
2025/01/26 16:40
그니깐 AI칩을 미국이 안파니깐 중국은 박사급 인재를 ai칩대신 갈았다는 소리지?
CV-3 Saratoga
2025/01/26 16:40
재밌네 중국에서 AI 나오면 이거 검열하고 저거 검열해서 아무것도 안될줄 알았는데 뭐가 존나 슉슉 나오는거 보니 격세지감인건지 아님 진짜 특이점이 온건지