تعد مسابقة معالجة اللغة والكلام الفيتنامية (VLSP) جزءًا من المؤتمر الدولي السنوي حول معالجة اللغة والكلام الفيتنامية الذي ينظمه نادي VLSP، وهو فرع من جمعية فيتنام لتكنولوجيا المعلومات. تنظم VLSP 2023 10 مسابقات في معالجة الكلام والنصوص، وتجمع بين الباحثين والخبراء ووحدات تطوير التكنولوجيا الرائدة.
على الرغم من أن هذه كانت المرة الرابعة التي تشارك فيها شركة Viettel AI في المسابقة وقد فازت بها ثلاث مرات من قبل، إلا أن مهندسي Viettel ما زالوا يواجهون العديد من الصعوبات بسبب التغييرات في هيكل فئة المسابقة.
وعلى وجه التحديد، وبالمقارنة مع العام الماضي، تم دمج فئتي التعرف على الكلام والتعرف على المشاعر هذا العام في فئة واحدة. كان على الفرق حل مشكلتين في نفس الوقت لضمان التعرف على النص والعاطفة الموجودة في الجملة، مما أدى إلى مضاعفة حجم العمل والصعوبة.
استخدم كل البيانات، سواء كانت منخفضة الجودة أو عالية الجودة
لا يقتصر اختبار هذا العام على تغيير بنية الفئات فحسب، بل يركز أيضًا على بناء نماذج من الصفر مع ظروف بيانات محدودة، بما في ذلك البيانات الخام وغير المصنفة وذات الجودة المنخفضة. يوفر الاختبار أربع مجموعات من البيانات بجودة وتنسيق مختلفين. هناك مجموعات بيانات تحتوي فقط على صوت غير مُسمّى، ومجموعات بيانات تحتوي فقط على صوت ونص، ومجموعات بيانات تحتوي على مشاعر وصوت، عالية الجودة، ومُسمّاة بشكل جيد، ومجموعات بيانات تحتوي على مشاعر وصوت، منخفضة الجودة. يتم تعريف كل مجموعة بيانات بشكل جيد لكل غرض وفئة اختبار، بإجمالي يزيد عن 300 ساعة عبر جميع مجموعات البيانات. وهذا رقم متواضع إلى حد ما مقارنة بمجموعات البيانات القياسية لتدريب التعرف على الكلام، والتي تتطلب عادة ما يصل إلى 1000-2000 ساعة أو أكثر.
كان لدى كل فريق أقل من شهرين للعمل على عمله وتقديمه، ولكن في الواقع كان الوقت الفعلي الذي تم قضاؤه في البحث عن الحلول أقل بكثير بسبب نقص الموارد.
قال السيد دانج دينه سون، مهندس الذكاء الاصطناعي، منصة المساعد الافتراضي، في شركة فيتيل للذكاء الاصطناعي: "هذا العام، خصصت شركة فيتيل للذكاء الاصطناعي قدرًا كبيرًا من موارد البنية التحتية للحوسبة للبحث عن تقنيات جديدة بالإضافة إلى تطوير المنتجات، في حين أن التعرف على الكلام هو تقنية تتطلب قدرًا كبيرًا من موارد الأجهزة".
في مواجهة حالة انخفاض حجم البيانات وجودتها، قرر فريق البحث على الفور وجهة النظر القائلة بـ "ضرورة الاستفادة من كافة البيانات بغض النظر عن جودتها المنخفضة أو العالية". وللقيام بذلك، من الضروري بناء دورة تدريبية تعالج كافة البيانات بالإضافة إلى نموذج واحد فقط يحل العديد من المشكلات المختلفة بدلاً من العديد من النماذج.
نتائج إتقان التكنولوجيا الرائدة
وفي سياق نقص البيانات ونقص الموارد، قرر فريق البحث بناء عملية معالجة بسيطة، ليست ضخمة، ولكن الأهم من ذلك، عملية معالجة دقيقة حتى أدق التفاصيل.
يدرس مهندسو الذكاء الاصطناعي في شركة Viettel بعناية أحدث الأبحاث من المؤتمرات والمجلات الرائدة في جميع أنحاء العالم للعثور على النهج المناسب. من خلال الجمع بين أساليب معالجة البيانات لتدريب النموذج بشكل فعال، قام فريق البحث ببناء دورة تدريبية لمعالجة جميع البيانات المتاحة. تتكون الدورة من ثلاث خطوات: بناء نموذج تدريب مسبق لوصف ميزات الصوت بدون تسميات، وضبط نموذج التدريب المسبق لمشكلتي التعرف على الكلام والتعرف على المشاعر، والاستدلال.
قال السيد بوي تيان دات، مهندس منصة المساعد الافتراضي في شركة فيتيل للذكاء الاصطناعي: "ساهمت الخبرة المكتسبة من حل مشاكل نقص البيانات خلال تطوير ونشر المنتجات السابقة بشكل كبير في مساعدة الفريق على إيجاد منهجية لاتخاذ القرار. بل على العكس، يُمكن تطبيق المعرفة والنتائج المكتسبة من الاختبار فورًا على منتجات فيتيل للذكاء الاصطناعي، لذا سارت عملية العمل أثناء الاختبار بسلاسة تامة".
ونتيجة لذلك، لم يفز فريق Viettel AI بالجائزة الأولى في فئتي التعرف على الكلام والتعرف على المشاعر الكلامية فحسب، بل حقق أيضًا درجة رائعة بلغت 89.18% (كانت الفرق التالية 83.40% و78.45% على التوالي).
وقال السيد سون إن العامل الرئيسي يكمن في نموذج معالجة الكلام المخصص للغة الفيتنامية والذي طورته شركة Viettel AI لفترة طويلة.
بدلاً من استخدام النماذج والتعليمات من نتائج الأبحاث المتاحة، اختارت شركة Viettel AI بناء وتطوير نموذجها الخاص لمعالجة الكلام الفيتنامي. ويُحدّث هذا النموذج ويُحسّن باستمرار، ويزداد فعاليته باستمرار، كما قال السيد سون.
ولا يتوقف الأمر عند إطار المنافسة فحسب، بل إن حل Viettel AI هذا سيكون بمثابة الأساس لترقية منتجات لوحة المفاتيح الافتراضية، والمساعد الافتراضي من Viettel، مما يساعد على تحديد مشاعر العملاء بشكل أكثر دقة في المحادثات، وبالتالي تقديم ملاحظات أو اختيار الفروق الدقيقة المناسبة للكلام. بهذه الطريقة، ستصبح المحادثات بين البشر والذكاء الاصطناعي أكثر طبيعية، مما يؤدي إلى تحسين تجربة المستخدم. كما تم فتح العديد من التطبيقات الجديدة في مجال رعاية العملاء، مثل بناء نظام آلي لتحديد شكاوى العملاء وطلباتهم الموجهة إلى لوحة التوزيع للتعامل معها في الوقت المناسب أو استغلال المعلومات.
وقال ممثل الوحدة إن شركة Viettel AI ستواصل تطوير التكنولوجيا وتحديث المنتجات باستمرار لزيادة الدقة وتعزيز تجربة المستخدم وكفاءة المنتج.
كوك توان
[إعلان 2]
مصدر
تعليق (0)