อินเท อ ร์เฟซ v7 คีย์บอร์ดที่ผสาน AI ภาพ: NVCC |
ตรี ดุก (เกิดปี พ.ศ. 2546) ได้เล่าถึงแนวคิดการประยุกต์ใช้ปัญญาประดิษฐ์เพื่อเปลี่ยนแปลงวิธีการป้อนข้อมูลภาษาเวียดนาม ให้กับ Tri Thuc - Znews เครื่องมือพิมพ์ดีด v7 ซึ่งเป็นโครงการนักศึกษาของเขา ได้พัฒนาเป็นงานวิจัยและได้รับการยอมรับให้เข้าร่วมการประชุมวิชาการด้านปัญญาประดิษฐ์ (IJCAI 2025) อันทรงเกียรติ
แม้จะได้รับความนิยมมานานหลายทศวรรษ แต่การพิมพ์ด้วย Telex หรือ VNI ก็ยังมีข้อจำกัดมากมายในด้านประสบการณ์การใช้งาน ดังนั้น v7 จึงถือกำเนิดขึ้นเพื่อเป็นเครื่องมือคาดการณ์ที่มีน้ำหนักเบา ซึ่งช่วยลดเวลาในการพิมพ์ภาษาเวียดนามด้วยการผสานรวม AI
ความหลงใหลในภาษาและเทคโนโลยี
ความรักที่มีต่อภาษาและเทคโนโลยีทำให้เขาได้เรียนวิชาเอกปัญญาประดิษฐ์ประยุกต์ที่มหาวิทยาลัยเทคโนโลยีนครโฮจิมินห์
ระหว่างการศึกษา เขาได้ริเริ่มโครงการต่างๆ เช่น แบบจำลองภาษาขนาดใหญ่ (LLM) สำหรับภาษาเวียดนาม ซอฟต์แวร์แปลภาษาชนกลุ่มน้อย หรือแชทบอทเพื่อสนับสนุนการรับสมัคร “ประสบการณ์เหล่านั้นช่วยให้ผมสะสมความรู้พื้นฐานที่มั่นคง บ่มเพาะความรักและความปรารถนาที่จะประยุกต์ใช้ AI เพื่อสร้างสรรค์ผลิตภัณฑ์ที่เป็นประโยชน์ต่อชุมชน” เขากล่าว
ตรี ดึ๊ก ต้องการนำคุณค่าจากการประยุกต์ใช้ AI มาใช้ในชีวิต ภาพ: NVCC |
นอกจากนี้ ด้วยพื้นฐานความรู้ด้านภาษาจีนกลางและภาษาจีนกวางตุ้ง ดึ๊กจึงตระหนักถึงความสัมพันธ์ระหว่างพินอิน/จฺยฺวฺผิงกับการสะกดคำในภาษาเวียดนาม ปัจจัยนี้ยังทำให้คุณเห็นได้ว่า ต่างจากความซับซ้อนของอักษรภาพ ระบบการพิมพ์พินอินของจีนเพียงแค่พิมพ์ “yn” ก็สามารถอ่านชื่อประเทศของเราด้วยอักษรฮั่นได้ ในขณะที่เทเล็กซ์หรือ VNI ต้องใช้คีย์ถึง 10 ตัวจึงจะอ่านคำว่า “เวียดนาม” ได้
จากการสังเกตของเขา ดยุกตระหนักว่าเมื่อสื่อสารอย่างรวดเร็ว ผู้ใช้มักจะย่อคำโดยคงพยัญชนะตัวแรกไว้ เช่น “hs” แทน “student” “หากมนุษย์เข้าใจรูปแบบการเขียนนี้ได้ง่าย AI ก็สามารถเข้าใจได้อย่างสมบูรณ์หากได้รับการฝึกฝนด้วยข้อมูลที่ถูกต้อง” เขากล่าวถึงสถานการณ์ที่ทำให้เกิดแนวคิดนี้
แทนที่จะต้องเขียนตัวอักษรเต็มตัวแล้วเพิ่มเครื่องหมายเน้นเสียงเมื่อใช้เครื่องมือพิมพ์แบบดั้งเดิมอย่าง Telex หรือ VNI ซึ่งใช้กลไกเสริม v7 จะใช้ AI เพื่อแนะนำคำที่คุณต้องการเขียน เทคโนโลยีนี้จะทำนายคำที่สมบูรณ์ได้อย่างแม่นยำโดยใช้แป้นพิมพ์น้อยที่สุดเท่าที่จะเป็นไปได้
ในโครงสร้างการสะกดคำภาษาเวียดนาม คำหนึ่งๆ ประกอบด้วยพยัญชนะต้น คำคล้องจอง และวรรณยุกต์ ตัวอย่างเช่น คำว่า "Nguyen" ประกอบด้วย "ng", "uyen" และวรรณยุกต์ตก ด้วยหลักการนี้ โปรแกรมพิมพ์ดีด v7 จึงถูกสร้างขึ้นเพื่อทำนายคำที่สมบูรณ์โดยใช้เพียงพยัญชนะต้นและวรรณยุกต์ ซึ่งช่วยลดจำนวนการกดแป้นพิมพ์ลงได้อย่างมาก แต่ยังคงรักษาความถูกต้องไว้ได้
ความท้าทายในการสอนภาษาเวียดนามให้กับ AI
ดึ๊กกล่าวว่าความท้าทายที่ใหญ่ที่สุดคือการสอน AI ให้ "เข้าใจ" ภาษาเวียดนามเพื่อใช้งานเครื่องมือพิมพ์นี้ เขาได้ทดลองใช้โมเดลต่างๆ มากมายก่อนที่จะเลือก GPT-2 เป็นพื้นฐาน โดยใช้สถาปัตยกรรม Transformers เพื่อการเข้าใจบริบทที่ดีและการคาดเดาคำที่แม่นยำ
หลังจากเลือกสถาปัตยกรรมพื้นฐานแล้ว ดึ๊กได้แทนที่ Tokenizer (ตัวเข้ารหัสคำศัพท์) ทั้งหมดด้วยคำศัพท์ภาษาเวียดนามที่เขาสร้างขึ้นเอง วิศวกรได้กรองคำศัพท์ภาษาเวียดนามที่ถูกต้องและสะกดถูกต้องทั้งหมดออก เพื่อให้มั่นใจว่าการประมวลผลจะครอบคลุม และคาดการณ์คำใดๆ ที่ผู้ใช้ต้องการเขียน
ความท้าทายอีกประการหนึ่งอยู่ที่การสร้างสมดุลระหว่างประสิทธิภาพการทำนายและความเร็วในการตอบสนอง เพื่อให้มั่นใจว่าโมเดลสามารถทำงานได้แบบเรียลไทม์ทั้งบนคอมพิวเตอร์และโทรศัพท์ แต่ยังคงมีประสิทธิภาพเพียงพอที่จะทำนายผลได้ดีที่สุด หลังจากการทดสอบอย่างต่อเนื่องเป็นเวลาสองเดือน เวอร์ชันปัจจุบันสามารถพิมพ์คำที่ผู้ใช้พิมพ์ได้ถูกต้องเกือบ 70% โดยมีความหน่วงเพียง 0.03 วินาที
สำหรับวิธีการป้อนข้อมูลของแป้นพิมพ์ จากการศึกษามากมายที่ดึ๊กได้ปรึกษากับนักภาษาศาสตร์อย่าง Cao Xuan Hao หรือ Henri Maspero พบว่าภาษาเวียดนามไม่ได้มีแค่ 6 เสียง แต่ถึง 8 เสียง เพื่อใช้ประโยชน์จากคุณสมบัตินี้ v7 จึงใช้ระบบเสียง 8 เสียงแทน 6 เสียงปกติ (รวมถึงเสียงโทนเรียบและเสียงเน้น 5 เสียง ได้แก่ ชาร์ป แฟลต คิวเรเตอร์ ฟอลลิ่ง และหนัก) ในแป้นพิมพ์นี้ เมื่อพิมพ์ "v7" รุ่นจะแนะนำคำว่า "Viet" ซึ่งก็เป็นที่มาของชื่อผลิตภัณฑ์เช่นกัน
หลังจากแชร์ v7 บนโซเชียลมีเดีย ดึ๊กกล่าวว่าเขาดีใจและประหลาดใจมากที่นางแบบได้รับความสนใจ การสนับสนุน และความปรารถนาที่จะได้สัมผัสประสบการณ์นี้ “นั่นทำให้ผมรู้สึกชัดเจนถึงความจำเป็นของเครื่องมือพิมพ์ภาษาเวียดนามที่ชาญฉลาดและรวดเร็วยิ่งขึ้น” เขากล่าว
กลุ่มผู้เขียนบทความวิจัย ทางวิทยาศาสตร์ จากซ้าย: นัท คัง, เฮียว เงีย และตรี ดึ๊ก ภาพ: NVCC |
ปัจจุบันคีย์บอร์ดนี้ยังอยู่ในขั้นต้นแบบ โดยมีโค้ดโอเพนซอร์สอยู่บน GitHub เพื่อให้โปรแกรมเมอร์หรือผู้ใช้เทคโนโลยีได้ทดสอบและมีส่วนร่วม นอกจากนี้ ยังมีการพัฒนาแอปพลิเคชันเวอร์ชันสมบูรณ์สำหรับ Windows และ macOS เพื่อให้ผู้ใช้ทั่วไปสามารถติดตั้งและใช้งานได้ง่าย
ในอนาคต เวอร์ชันแป้นพิมพ์บน iPhone จะเป็นสิ่งที่สำคัญสูงสุดสำหรับ v7 เพื่อปรับปรุงวิธีการป้อนข้อความภาษาเวียดนามบนสมาร์ทโฟน นอกจากนี้ โมเดลนี้จะได้รับการปรับปรุงความแม่นยำโดยการฝึกใช้ข้อมูลการสนทนาในชีวิตประจำวันมากขึ้น ซึ่งจะช่วยให้ AI เข้าใจบริบททั่วไปได้ดีขึ้น
การเดินทางของดึ๊กได้มีส่วนช่วยสร้างสรรค์ผลงานอันน่าทึ่ง โดยก้าวทันเทรนด์เทคโนโลยีในบริบทที่เวียดนามลงทุนอย่างหนักในโครงสร้างพื้นฐาน AI ช่วงเวลาหนึ่งที่ทำให้เขาภาคภูมิใจคือตอนที่ v7 สร้างประโยคที่สมบูรณ์ได้เป็นครั้งแรก "ตอนนั้นโมเดลขนาดเล็ก ซึ่งน่าจะมีขนาดเพียง 1 ใน 10,000 ของ ChatGPT ในปัจจุบัน ยังสามารถคิดได้เหมือนมนุษย์" ดึ๊กกล่าว
ที่มา: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
การแสดงความคิดเห็น (0)