DeepSeek R1의 놀라운 점은… 1. 성능이 o1에 근접했다는 거 2. 근데 비용이 o1보다 95…

DeepSeek R1의 놀라운 점은…

1. 성능이 o1에 근접했다는 거
2. 근데 비용이 o1보다 95% 싸다는 거
3. 오픈소스라 누구나 다운받아 컴퓨터에서 돌리면 된다는 거
4. 가장 작은 모델은 2gb가 안 되기 때문에 이런 작은 고성능 모델이 iPhone 애플 인텔리전스 등에 들어가면 갑자기 유용성이 확 올라갈 수 있다는 거
5. 모델 파일들만 공개한 게 아니라 어떻게 연구했고 어떻게 문제들을 해결해서 저 성능을 냈는지 논문도 그냥 공개. 어떻게 합성 데이타를 만들고 생각하는 레이어를 더해서 성능 향상을 하고 다음 세대 모델에 그 성능을 농축해서(distill) 고스란히 넘기는지 다 공개
6. 그 내용에 따르면 저 모델 가져다 각자 AI 연구팀에서 조금만 노력하면 AGI 이룰 수 있을 만한 내용
7. 이걸 NVIDIA 최신 칩을 못 쓰기 때문에 대량 훈련보다 기능 향상에 집중했을 중국에서 해내고 모두가 가져다 사용하고 더 개선할 수 있게 모든 걸 다 풀어버림
8. OpenAI 가 최근까지 경쟁 업체들에 비해 2-3년 앞서있다는 평가가 있었는데 이게 아마 12개월 미만으로 좁혀질 것 같음. o3 가 얼마나 더 높은 성능일지, 그걸 따라잡는 DeepSeek 등 업체들의 차기 모델은 또 얼마나 빠르게 발표될지, 흥미진진.