โมเดลใหม่นี้ไม่เพียงแต่ท้าทายความโดดเด่นของยักษ์ใหญ่ในอเมริกาเท่านั้น แต่ยังปรับเปลี่ยนรูปแบบเกมทั้งหมดด้วยโอเพนซอร์สอีกด้วย (ภาพประกอบ: DS)
โมเดลนี้มีพารามิเตอร์ 685 พันล้านตัว และเผยแพร่ภายใต้ใบอนุญาตโอเพนซอร์ส ผลการทดสอบเบื้องต้นแสดงให้เห็นว่าประสิทธิภาพเทียบเท่ากับระบบที่เป็นกรรมสิทธิ์ของ OpenAI หรือ Anthropic และเปิดแนวทางใหม่ในการพัฒนาและเผยแพร่โมเดล AI ขั้นสูง
ประสิทธิภาพและต้นทุน
หลังจากเปิดตัวบนแพลตฟอร์ม Hugging Face ไม่นาน DeepSeek V3.1 ก็ทำคะแนนได้ 71.6% ในการทดสอบการเขียนโปรแกรมของ Aider ในทางเทคนิคแล้ว โมเดลนี้สามารถจัดการบริบทได้มากถึง 128,000 โทเค็น (เทียบเท่าหนังสือประมาณ 400 หน้า) สถาปัตยกรรมนี้ถูกอธิบายว่าเป็นแบบ "ไฮบริด" ที่ผสานรวมฟังก์ชันการสนทนา การให้เหตุผล และการเขียนโปรแกรมเข้าด้วยกัน
“DeepSeek V3.1 ทำได้ 71.6% บน Aider สูงกว่า Claude Opus 4 ประมาณ 1% ในขณะที่มีต้นทุนน้อยกว่าอย่างเห็นได้ชัด” Andrew Christianson นักวิจัยด้าน AI กล่าวบนเครือข่ายโซเชียล X
คาดว่าค่าใช้จ่ายโดยเฉลี่ยในการดำเนินการงานการเขียนโปรแกรมโดยใช้ V3.1 อยู่ที่ประมาณ 1.01 ดอลลาร์สหรัฐฯ ในขณะที่ระบบที่เทียบเท่ากันอาจมีค่าใช้จ่ายใกล้เคียง 70 ดอลลาร์สหรัฐฯ
นักพัฒนาชุมชนบางรายยังสังเกตเห็นการมีอยู่ของ "โทเค็นพิเศษ" สี่รายการในสถาปัตยกรรม ซึ่งช่วยให้โมเดลสามารถบูรณาการการค้นหาเว็บแบบเรียลไทม์และจัดการกระบวนการอนุมานที่ซับซ้อนได้
ความแตกต่างนี้ส่งผลให้ธุรกิจต่างๆ ที่ต้องจัดการปฏิสัมพันธ์ AI หลายพันรายการทุกวันสามารถประหยัดเงินได้หลายล้านดอลลาร์
ข้อได้เปรียบที่เปลี่ยนแปลงเกม
การเปิดตัว V3.1 เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากที่ OpenAI และ Anthropic ประกาศโมเดลใหม่ การเลือกใช้วิธีโอเพนซอร์สของ DeepSeek ทำให้ DeepSeek ใช้กลยุทธ์ที่แตกต่างจากบริษัทในสหรัฐอเมริกาหลายแห่งที่นำโมเดล AI เชิงพาณิชย์มาใช้ผ่าน API แบบชำระเงิน
บางคนโต้แย้งว่าการทำให้ความสามารถขั้นสูงพร้อมใช้งานอย่างแพร่หลายอาจช่วยให้องค์กรและธุรกิจต่างๆ สามารถปรับใช้ได้รวดเร็วยิ่งขึ้น ในขณะเดียวกันก็ท้าทายรูปแบบธุรกิจที่อิงตามการผูกขาดทางเทคโนโลยีอีกด้วย
การเกิดขึ้นของ DeepSeek V3.1 แสดงให้เห็นว่า AI ขั้นสูงไม่ได้เป็นเพียงแค่โดเมนขององค์กรขนาดใหญ่เท่านั้น แต่ยังรวมถึงกลุ่มวิจัยขนาดเล็กด้วย
การแข่งขันในพื้นที่นี้ไม่จำกัดอยู่เพียงการสร้างระบบที่ทรงพลังที่สุดอีกต่อไป แต่ยังรวมถึงการทำให้เทคโนโลยีเข้าถึงได้และราคาไม่แพงอีกด้วย
ในบริบทนั้น คำถามสำหรับบริษัทเทคโนโลยีก็คือ จะรักษามูลค่าเชิงพาณิชย์ได้อย่างไรเมื่อมีโมเดลโอเพนซอร์สที่มีประสิทธิภาพและต้นทุนที่สามารถแข่งขันได้มากขึ้นเรื่อยๆ
ที่มา: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
การแสดงความคิดเห็น (0)