ตามประกาศของ Tencent ในบัญชี WeChat อย่างเป็นทางการ รุ่น T1 ที่ได้รับการปรับปรุงให้ความเร็วในการตอบสนองที่เร็วขึ้นและจัดการเอกสารข้อความยาวๆ ได้ดีกว่า
Tencent เปิดตัวโมเดลอนุมาน T1 ซึ่งมีประสิทธิภาพเหนือกว่า DeepSeek ในด้านตัวชี้วัดความรู้และความสามารถในการใช้เหตุผลหลายประการ
โพสต์ดังกล่าวยังระบุว่า T1 สามารถ "รักษาตรรกะของเนื้อหาให้ชัดเจนและรักษาข้อความให้เป็นระเบียบเรียบร้อย" และอัตราการเกิด "ภาพหลอน" ซึ่งเป็นปรากฏการณ์ที่ AI สร้างข้อมูลที่ไม่ถูกต้องนั้น "ต่ำมาก"
การเปิดตัวดังกล่าวเกิดขึ้นท่ามกลางการแข่งขันที่รุนแรงในตลาด AI ของจีน โดยเฉพาะหลังจากที่ DeepSeek เปิดตัวโมเดลที่มีประสิทธิภาพเทียบเท่าหรือดีกว่าระบบของตะวันตก โดยมีต้นทุนต่ำกว่าอย่างมาก
ก่อนหน้านี้ Tencent ได้เปิดตัว T1 เวอร์ชันเบต้าบนแพลตฟอร์มต่างๆ รวมถึงแอปผู้ช่วย AI ที่ชื่อว่า Yuanbao
เวอร์ชันอย่างเป็นทางการจะถูกขับเคลื่อนโดยโมเดลภาษาแพลตฟอร์ม Turbo S ของ Tencent ซึ่งได้รับการประกาศเมื่อปลายเดือนที่แล้ว บริษัทอ้างว่า Turbo S ประมวลผลคำถามได้เร็วกว่ารุ่น R1 ของ DeepSeek ที่เป็นคู่แข่ง
แผนภูมิที่ตีพิมพ์ในโพสต์ที่เปรียบเทียบโมเดล T1 กับ DeepSeek R1 แสดงให้เห็นว่าผลิตภัณฑ์ของ Tencent โดดเด่นในด้านการวัดความรู้และความสามารถในการใช้เหตุผลหลายๆ อย่าง
Tencent ได้เพิ่มการลงทุนใน AI ในช่วงไม่กี่เดือนที่ผ่านมา เมื่อวันพฤหัสบดี บริษัทได้ประกาศแผนที่จะเพิ่มการใช้จ่ายด้านเงินทุนจนถึงปี 2025 หลังจากใช้จ่ายอย่างหนักกับ AI จนถึงปี 2024
T1 ได้รับการจัดอันดับสูงในเกณฑ์มาตรฐานปัญญาประดิษฐ์ที่สำคัญหลายรายการ ซึ่งทำให้มันกลายเป็นหนึ่งในโมเดลระดับท็อปของโลก
การประเมินล่าสุดระบุว่า T1 ได้คะแนน 87.2 ใน MMLU-Pro ซึ่งเป็นชุดข้อมูลที่ประเมินความสามารถในการใช้เหตุผลพื้นฐานในโมเดลภาษาขนาดใหญ่ คะแนนนี้เป็นรองเพียง OpenAI o1 เท่านั้น
นอกจากนี้ T1 ยังมีประสิทธิภาพที่ดีในเกณฑ์มาตรฐานสาธารณะเช่น CEval, AIME และ Zebra Logic มาตรฐานเหล่านี้วัดความรู้ทั่วไปและการใช้เหตุผลทั้งในภาษาจีนและภาษาอังกฤษ
ที่มา: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm
การแสดงความคิดเห็น (0)