이 새로운 모델은 미국 거대 기업의 지배력에 도전할 뿐만 아니라 오픈 소스를 통해 게임 전체를 재구성합니다(그림: DS).
이 모델은 6,850억 개의 매개변수를 가지고 있으며 오픈 소스 라이선스로 배포됩니다. 초기 테스트 결과, OpenAI나 Anthropic의 자체 시스템과 동등한 성능을 보였으며, 고급 AI 모델 개발 및 배포에 대한 새로운 접근 방식을 제시합니다.
성능 및 비용
DeepSeek V3.1은 Hugging Face 플랫폼 출시 직후 Aider 프로그래밍 테스트에서 71.6%의 점수를 받았습니다. 기술적으로 이 모델은 최대 128,000개의 토큰(약 400페이지 분량의 책에 해당)의 컨텍스트를 처리할 수 있습니다. 이 아키텍처는 대화, 추론, 프로그래밍 기능을 통합한 "하이브리드" 아키텍처로 설명됩니다.
AI 연구원 앤드류 크리스티안슨은 소셜 네트워크 X에서 "DeepSeek V3.1은 Aider에서 71.6%의 성과를 달성했는데, 이는 Claude Opus 4보다 약 1% 더 높은 수치이며 비용은 훨씬 저렴합니다."라고 밝혔습니다.
V3.1을 사용하여 프로그래밍 작업을 완료하는 데 드는 평균 비용은 약 1.01달러로 추산되며, 동등한 시스템의 비용은 70달러에 가깝습니다.
일부 커뮤니티 개발자는 아키텍처에 네 가지 "특수 토큰"이 있다는 점도 언급했는데, 이를 통해 모델이 실시간 웹 검색을 통합하고 복잡한 추론 프로세스를 처리할 수 있게 되었습니다.
이러한 차이는 매일 수천 건의 AI 상호작용을 처리하는 기업의 경우 수백만 달러의 비용 절감으로 이어집니다.
게임의 판도를 바꾸는 이점
V3.1 릴리스는 OpenAI와 Anthropic이 새로운 모델을 발표한 지 몇 주 만에 출시되었습니다. DeepSeek은 오픈소스 방식을 선택함으로써 유료 API를 통해 AI 모델을 상용화하는 많은 미국 기업들과는 다른 전략을 취하고 있습니다.
일부에서는 고급 기능을 널리 제공하면 조직과 기업이 더 빠르게 배포할 수 있으며, 동시에 기술 독점에 기반한 비즈니스 모델에 도전할 수 있다고 주장합니다.
DeepSeek V3.1의 등장은 첨단 AI가 대기업만의 영역이 아니라 소규모 연구 그룹의 영역이라는 것을 보여줍니다.
이 분야의 경쟁은 더 이상 가장 강력한 시스템을 구축하는 데 국한되지 않고, 기술을 접근성과 경제성 측면에서 접근 가능하게 만드는 것에도 중점을 두고 있습니다.
이러한 맥락에서 기술 기업이 직면한 문제는 경쟁력 있는 성능과 비용을 갖춘 오픈 소스 모델이 점점 더 많이 등장함에 따라 상업적 가치를 어떻게 유지할 것인가입니다.
출처: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
댓글 (0)