작년에 Midjourney가 Stable Diffusion을 이미지 도용 혐의로 고발한 것보다 더 놀라운 위선적인 행위로, ChatGPT와 DALL-E 개발사 OpenAI는 최근 NVIDIA가 미국 주식 시장 역사상 가장 큰 단일 일 폭락을 기록하여 17%(약 6,000억 달러)를 기록하게 만든 AI 타운의 신생 기업인 DeepSeek가 자사 AI 모델을 훈련하기 위해 데이터를 훔쳤다고 주장했습니다.
Financial Times에 따르면, OpenAI는 대규모 AI 모델에서 소규모 모델로 지식을 이전하는 머신 러닝 기술인 "증류distillation"의 증거를 발견했다고 합니다. OpenAI는 중국 회사가 이를 저질렀다고 믿고 있습니다.
보고서에 따르면, OpenAI와 Microsoft는 작년에 OpenAI의 API를 사용하는 DeepSeek에 속한다고 여겨지는 계정을 조사했습니다. 이러한 계정은 이후 증류에 관여했다는 의심으로 차단되었는데, 이는 사용자가 OpenAI와 경쟁하는 모델을 개발하는 데 서비스 출력을 사용하는 것을 금지하는 OpenAI의 서비스 약관을 위반한 것입니다. FT에서 연락했을 때 ChatGPT 개발자는 더 이상 언급하거나 DeepSeek를 주장된 활동과 연결하는 증거를 제공하지 않았습니다.
"AI에는 증류distillation라는 기술이 있는데, 한 모델이 다른 모델에서 학습하여 부모 모델에서 지식을 빨아내는 것입니다." 백악관 고문인 데이비드 삭스는 이러한 주장된 증류distillation에 대해 앞서 말했습니다. "그리고 DeepSeek이 여기서 한 일이 OpenAI 모델에서 지식을 증류했다는 상당한 증거가 있으며, OpenAI가 이에 대해 매우 기뻐하지 않을 것이라고 생각합니다."
말할 것도 없이, 최근 몇 년 동안 회사를 상대로 제기된 소송의 엄청난 수를 감안할 때 OpenAI에서 제기된 이러한 비난은 터무니없이 과장된 것입니다. 그 중 많은 소송은, 예상하셨겠지만, 저작권 침해와 관련이 있습니다. 뉴욕 타임즈와 캐나다 미디어 기업부터 인도 출판사, 조지 R.R. 마틴, 심지어 엘론 머스크까지 – 이들은 OpenAI에 대해 법적 조치를 취한 원고 중 일부에 불과하며, 1년 전 게리 마커스와 레이드 사우센이 발견한 DALL-E의 이미지 스크래핑 사례는 언급조차 하지 않았습니다.
이전에 OpenAI는 "저작권이 있는 자료를 사용하지 않고는 오늘날의 선도적인 AI 모델을 훈련하는 것은 불가능할 것"이라고 인정했지만, 이제 그들이 받는 입장에 처하게 되면서 다른 사람의 데이터를 AI 훈련에 사용하는 것이 갑자기 용납할 수 없는 것으로 간주되어 일부 거대 기술 거물들이 살고 있는 "나에게는 좋지만 너에게는 좋지 않다"는 망상을 다시 한번 드러냈습니다.
디지털 아트워크를 스크래핑으로부터 보호하려면 (광고가 아님) AI 감지로부터 아트워크를 숨기고 스타일 모방을 방지할 수 있는 도구인 Glaze와 본질적으로 이미지를 "독살"하고 생성 AI 모델에서 특징 표현을 왜곡하는 도구인 Nightshade를 사용해 보는 것을 적극 권장합니다. 2024년 OpenAI 대변인이 말했듯이, 이 회사는 이러한 기술의 사용을 "남용"으로 보고 있으며, 이는 그 효과성을 간접적으로 확인하는 역할을 합니다.
----------------------------------------
딥시크의 성과가 효율적인 최적화를 통해 성능을 이끌어 냈다는 건데, 그에 대한 기반이 타사 AI의 학습 정보를 디스틸레이션 해서 빨아 먹고 썼다는 것.
그 구조적 효율성과 별개로 학습에 필요한 기반은 딥시크가 만든 효율성과 거리가 있는데 이게 걍 오픈AI 거 긴빠이 쳐서 얻은 거라는듯.
이번 사태는 결국 오픈 AI의 업보가 사람들에게 오랬동안 쌓여있던게 제일 큰 원흉 같다
지도훔쳐노코탓탓
그때 샘 알트먼 짤렸을 때 걍 짤리게 놔뒀어야 했다
거 어차피 지금 있는 대다수 ai들 전부 인터넷상의 빅데이터 허락없이 쓴거아닌고
최면두꺼비 대왕
2025/01/29 21:20
이번 사태는 결국 오픈 AI의 업보가 사람들에게 오랬동안 쌓여있던게 제일 큰 원흉 같다
나만정상인
2025/01/29 21:20
그리고 본문에도 언급했다시피 "지들은 대놓고 훔쳐놓고 나몰라라 하더니 당한 것 같으니까 거품 문다."고 조롱받는 중
!
2025/01/29 21:22
지도훔쳐노코탓탓
라미아에게착정당하고싶다
2025/01/29 21:23
그때 샘 알트먼 짤렸을 때 걍 짤리게 놔뒀어야 했다
고양이육구
2025/01/29 21:23
거 어차피 지금 있는 대다수 ai들 전부 인터넷상의 빅데이터 허락없이 쓴거아닌고
총설배강
2025/01/29 21:23
오픈ai도 솔직히 ai학습이 회색영역인걸로 일반 유저들 데이터 수집 존나게 했잖아?
KC인증-1260709925
2025/01/29 21:24
열심히 도둑질하다가 도둑질당하니 성내는건 누구양심