Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

ดร. เดา ดึ๊ก มินห์: 'การเชี่ยวชาญข้อมูลเวียดนามเป็นก้าวแรกในการพัฒนาและเชี่ยวชาญเทคโนโลยีเวียดนาม'

Báo Thanh niênBáo Thanh niên27/05/2024

รูปภาพ หลังจากทำงานให้กับองค์กรปัญญาประดิษฐ์ขนาดใหญ่ในสหรัฐอเมริกา ทำไมคุณถึงตัดสินใจกลับมาเวียดนามเพื่อร่วมงานกับ VinBigdata? ระหว่างที่ทำงานในสหรัฐอเมริกา แม้ว่าผมจะได้มีส่วนร่วมในโครงการขนาดใหญ่ ของรัฐบาล หลายโครงการ แต่ผลลัพธ์ที่ได้มักจะเป็นเพียงขั้นตอนเล็กๆ น้อยๆ ในกระบวนการประมวลผลขนาดใหญ่ หลายครั้ง เนื่องจากขั้นตอนการรักษาความลับที่เข้มงวดมากของโครงการ ผมจึงไม่รู้ด้วยซ้ำว่าโซลูชันที่ผมพัฒนาขึ้นนั้นถูกนำไปใช้อย่างไร ในปี 2560 ผมกลับไปเวียดนามในช่วงที่เวียดนามยังอยู่ในช่วงพัฒนา และมีปัญหามากมายเกี่ยวกับข้อมูลขนาดใหญ่และปัญญาประดิษฐ์ที่ต้องได้รับการแก้ไข ผมตอบรับคำเชิญของศาสตราจารย์หวู่ ห่า วัน ให้ร่วมกันบรรลุเป้าหมายในการพัฒนาโซลูชันเทคโนโลยีของเวียดนามเพื่อช่วยเหลือชีวิตความเป็นอยู่ของชาวเวียดนาม การกลับมาเวียดนามครั้งนี้มีความหมายมากขึ้น เพราะผมจะได้ทำงานกับปัญหาที่มีผลกระทบมากขึ้น
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

ดร. เดา ดึ๊ก มินห์ ในการประชุมเชิงปฏิบัติการ

เอ็นวีซีซี

ในกลยุทธ์การพัฒนาปัญญาประดิษฐ์ บทบาทและอิทธิพลของข้อมูลขนาดใหญ่คืออะไรครับ? ข้อมูลมีบทบาทสำคัญและมีคุณค่าอย่างยิ่งในการฝึกอบรมปัญญาประดิษฐ์ การฝึกอบรมแบบจำลองปัญญาประดิษฐ์ที่มีคุณภาพสูงมักเริ่มต้นด้วยการฝึกอบรมฐานข้อมูลขนาดใหญ่ ดังนั้น เพื่อให้ได้ปัญญาประดิษฐ์ที่มีคุณภาพ เราจำเป็นต้องมีข้อมูลที่ดีก่อน ข้อมูลที่ดีต้องเป็นไปตามมาตรฐานทั้งในด้านปริมาณและขนาด คุณภาพ ความหลากหลาย และความเป็นสากล กระบวนการรวบรวมและประมวลผลข้อมูลดิบหลายพันชั่วโมงตั้งแต่ขั้นตอนการล้างข้อมูลเพื่อสร้างข้อมูลคุณภาพสูงที่สุดเพื่อป้อนเข้าสู่แบบจำลองปัญญาประดิษฐ์นั้นมีค่าใช้จ่ายสูงและซับซ้อน ในทางกลับกัน ในการวิเคราะห์ข้อมูลขนาดใหญ่ เราจำเป็นต้องใช้ปัญญาประดิษฐ์เพื่อให้มั่นใจว่าสามารถประมวลผลข้อมูลได้อย่างแม่นยำในวงกว้าง ซึ่งจะทำให้ได้ผลลัพธ์ที่ชัดเจนและคาดการณ์ได้แม่นยำยิ่งขึ้น ยกตัวอย่างเช่น ในกระบวนการพัฒนาผลิตภัณฑ์ผู้ช่วยเสมือนสำหรับชาวเวียดนาม (ViVi) เราต้องรวบรวมและประมวลผลข้อมูลเสียงคุณภาพสูงหลายหมื่นชั่วโมง จากเสียงหลายแสนเสียงจากหลากหลายภูมิภาค หลากหลายวัยและเพศ โดยมีเนื้อหาครอบคลุมหลายร้อยสาขา... หรือล่าสุดคือการเปิดตัว ViGPT - "ChatGPT เวอร์ชันภาษาเวียดนามแรกสำหรับผู้ใช้ปลายทาง" ซึ่งพัฒนาจาก Big Language Model ที่ VinBigdata เป็นเจ้าของทั้งหมด โมเดลนี้ได้รับการฝึกฝนจากข้อมูลภาษาเวียดนามที่ผ่านการปรับแต่งแล้วขนาด 600 GB จากหลากหลายสาขา ด้วยความเข้าใจในข้อมูลและภาษาเวียดนาม เราจึงค้นพบวิธีการใหม่ที่ช่วยลดระยะเวลาการเปิดตัว ViGPT ให้เหลือเพียง 9 เดือนหลังจาก ChatGPT ถือกำเนิดขึ้น นี่คือการสั่นพ้องระหว่างข้อมูลขนาดใหญ่และปัญญาประดิษฐ์
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
คุณมีความคิดเห็นอย่างไรเกี่ยวกับการเชื่อมโยงงานวิจัยกับคุณค่าเชิงปฏิบัติเพื่อประโยชน์ต่อชุมชน? - ผมเชื่อว่าการวิจัยเทคโนโลยีจะประสบความสำเร็จอย่างแท้จริงได้ก็ต่อเมื่อได้นำไปใช้ในชีวิตจริง แก้ไขปัญหาสังคม และพัฒนาคุณภาพชีวิตของผู้คน เพื่อสร้างผลิตภัณฑ์เชิงพาณิชย์ที่ใช้งานได้จริงและแก้ไขปัญหาทางธุรกิจและสังคม เราต้องใส่ใจและตั้งคำถามอยู่เสมอว่า ข้อมูลจะสร้างคุณค่าอะไรให้กับชีวิต? จนถึงปัจจุบัน เราได้ทำการวิจัยผลิตภัณฑ์และโซลูชันที่หลากหลายในหลากหลายอุตสาหกรรมและสาขา เช่น ViGPT, VinDr ซึ่งเป็นโซลูชัน AI สำหรับการวินิจฉัยภาพทางการ แพทย์ , VinBase ซึ่งเป็นแพลตฟอร์มสำหรับปัญญาประดิษฐ์ หรือ Vizone ซึ่งเป็นชุดโซลูชันการวิเคราะห์ภาพอัจฉริยะ
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

พร้อมด้วยบุคลากรสำคัญของ VinBigdata ในงานของ Vingroup Corporation

เอ็นวีซีซี

การปฏิวัติอุตสาหกรรมครั้งที่ 4 กำลังเกิดขึ้นอย่างเข้มข้นในระดับโลก คุณคิดว่าเวียดนามมีข้อได้เปรียบอะไรบ้าง? เมื่อเทียบกับการปฏิวัติครั้งก่อนๆ ผมคิดว่าเวียดนามมีข้อได้เปรียบมากมายในการก้าวข้ามผ่านการปฏิวัติอุตสาหกรรม 4.0 ซึ่งจะช่วยยกระดับตำแหน่งของประเทศบนแผนที่ โลก กุญแจสำคัญสองประการในการบรรลุเป้าหมายนี้คือข้อมูลและประชากร ปัจจุบันเวียดนามมีประชากรเกือบ 100 ล้านคน ซึ่งในจำนวนนี้เป็นคนหนุ่มสาวที่ใช้โทรศัพท์และคอมพิวเตอร์ส่วนบุคคลเป็นจำนวนมาก นอกจากนี้ เรายังมีผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ที่มีชื่อเสียง บุคลากรรุ่นใหม่ที่มีคุณภาพสูงด้านเทคโนโลยีสารสนเทศ และมีพื้นฐานทางคณิตศาสตร์ที่ดีมาก แล้ว ข้อจำกัดล่ะ? ข้อจำกัดประการแรกที่เห็นได้คือ แม้จะมีประชากรจำนวนมาก แต่เรายังคงประสบปัญหาในการจัดการข้อมูล โดยเฉพาะการสร้างมาตรฐานและการซิงโครไนซ์ข้อมูล ณ สถานที่ หน่วยธุรกิจ และหน่วยงานต่างๆ นอกจากนี้ เรายังเผชิญกับข้อจำกัดอื่นๆ เช่น ทรัพยากรการลงทุนที่จำกัด โดยเฉพาะการลงทุนในโครงสร้างพื้นฐานการประมวลผลประสิทธิภาพสูง
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
ในความคิดเห็นของคุณ การเรียนรู้ข้อมูลภาษาเวียดนามมีความสำคัญเพียงใดต่อการสร้างและควบคุมเทคโนโลยีเพื่อตอบโจทย์ชีวิตความเป็นอยู่ของชาวเวียดนาม ปัจจุบันมีผลิตภัณฑ์ปัญญาประดิษฐ์ชั้นนำมากมายจากทั่วโลก ซึ่งโดยทั่วไปแล้วจะเป็นผลิตภัณฑ์แอปพลิเคชัน AI ที่สร้างขึ้นจากแบบจำลองภาษาขนาดใหญ่ เช่น ChatGPT โดย OpenAI หรือ Bard โดย Google อย่างไรก็ตาม ภาษาเวียดนามไม่ใช่กลุ่มภาษาหลักในการพัฒนาผลิตภัณฑ์เหล่านี้ ดังนั้น คุณภาพของเนื้อหาเฉพาะภาษาเวียดนามที่ส่งถึงผู้ใช้จึงได้รับผลกระทบไม่มากก็น้อย และมีความเสี่ยงสูงที่จะเกิดข้อผิดพลาด และที่อันตรายกว่านั้นคือข้อผิดพลาดในความรู้พื้นฐาน ในฐานะชาวเวียดนาม เรามีข้อได้เปรียบในการเข้าถึงแหล่งข้อมูลของเราเอง มีเพียงเราเท่านั้นที่สามารถเข้าใจลักษณะของข้อมูล ความต้องการ และลักษณะนิสัยของชาวเวียดนาม ดังนั้น การเรียนรู้ข้อมูลภาษาเวียดนามจึงเป็นกุญแจสำคัญในการทำความเข้าใจเทคโนโลยีหลัก ซึ่งเป็นเทคโนโลยีที่จะตอบโจทย์ชาวเวียดนามเช่นกัน
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

การฝึกอบรมภายในสำหรับสมาชิก VinBigdata

เอ็นวีซีซี

จะเข้าถึงแหล่งข้อมูลเฉพาะเจาะจงได้อย่างไร โดยเฉพาะอย่างยิ่งเมื่อชาวเวียดนามส่วนใหญ่ในปัจจุบันใช้เว็บไซต์โซเชียลเน็ตเวิร์กจากต่างประเทศ อันที่จริง แหล่งข้อมูลมนุษย์ที่ใหญ่ที่สุดในปัจจุบัน (ไม่ใช่แค่ชาวเวียดนามเท่านั้น) คืออินเทอร์เน็ตและโซเชียลเน็ตเวิร์ก อย่างไรก็ตาม เรายังคงสามารถเข้าถึงและรวบรวมข้อมูลจากแหล่งต่างๆ ได้ โดยอาศัยความเข้าใจในคุณลักษณะของข้อมูลเวียดนาม ซึ่งขึ้นอยู่กับคุณลักษณะที่กำหนดโดยแต่ละโครงการ ยกตัวอย่างเช่น แบบจำลอง GPT ของ OpenAI มีพารามิเตอร์หลายร้อยหรือหลายล้านล้านตัว ได้รับการฝึกฝนจากข้อมูลจำนวนมหาศาล และมีค่าใช้จ่ายหลายพันล้านดอลลาร์ เมื่อเปรียบเทียบกับแบบจำลองเหล่านี้ เราได้เลือกแนวทางที่แตกต่างอย่างสิ้นเชิงโดยพิจารณาจากการวิจัย ความสามารถ และทรัพยากรของเรา นั่นคือ การสร้างแบบจำลองภาษาเวียดนามที่มีสถาปัตยกรรมพารามิเตอร์เพียงไม่กี่พันล้านตัว ฝึกฝนจากชุดข้อมูลภาษาเวียดนามขนาด 600 GB ที่เรารวบรวมและปรับแต่งเอง แต่มีความสามารถในการประมวลผลภาษาเวียดนามในระดับเดียวกัน ผลการวิจัยแสดงให้เห็นว่าสถาปัตยกรรมที่เราพัฒนาขึ้นเองสามารถปรับให้เหมาะสมได้เอง ลดระยะเวลาในการฝึกแบบจำลองภาษา ลดต้นทุน และยังคงรักษาคุณภาพของแบบจำลองไว้ ได้ อะไรคือความท้าทายที่คุณและทีมของคุณเผชิญในกระบวนการวิจัยและพัฒนาผลิตภัณฑ์ปัญญาประดิษฐ์ ความท้าทายแรกคือเรื่องเวลาอย่างแน่นอน กระแสเทคโนโลยีปัญญาประดิษฐ์กำลังมาอย่างรวดเร็วและกำลังอยู่ในช่วงที่เทคโนโลยีกำลังเติบโตอย่างรวดเร็ว บริษัทเทคโนโลยีชั้นนำทั่วโลกต่างเปิดตัวผลิตภัณฑ์ที่สมบูรณ์แบบพร้อมการอัปเดตและพัฒนาอย่างต่อเนื่อง หากเราล่าช้าและไม่เปิดตัวผลิตภัณฑ์ทันเวลา เราก็จะล้าหลังอย่างแน่นอน ในทางกลับกัน หากเราต้องการสร้างผลิตภัณฑ์ที่สามารถนำไปประยุกต์ใช้และแก้ไขปัญหาสังคมได้จริง เราต้องพิจารณาค้นหาและพัฒนาคุณสมบัติที่โดดเด่น พิเศษ และเป็นเอกลักษณ์ของผลิตภัณฑ์ด้วย
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

การนำเสนอที่งาน Vietnam Artificial Intelligence Day (AI4VN 2023)

เอ็นวีซีซี

ในความเป็นจริง บุคคลและองค์กรจำนวนมากทั้งในเวียดนามและทั่วโลกต่างประสบกับความสูญเสียครั้งใหญ่จากการรั่วไหลของข้อมูล คุณมองประเด็นเรื่องความปลอดภัยของข้อมูลอย่างไร? กล่าวได้ว่าแอปพลิเคชันใดๆ ในปัจจุบันล้วนมาจากข้อมูล ในการทำงานกับข้อมูล ในด้านหนึ่ง เราต้องมั่นใจว่าเป้าหมายของการนำข้อมูลมาใช้เพื่อสร้างเทคโนโลยีที่ดีที่สุดสำหรับชีวิต และในอีกด้านหนึ่ง เราต้องสร้างความมั่นใจด้านความปลอดภัยของข้อมูลสำหรับบุคคลและองค์กร ปัจจัยด้านมนุษย์เป็นปัจจัยสำคัญอย่างยิ่งในกระบวนการสร้างความมั่นใจด้านความปลอดภัยของข้อมูล ซึ่งรวมถึงนักพัฒนา ผู้ใช้ผลิตภัณฑ์ และผู้ใช้ สำหรับนักพัฒนา จำเป็นต้องตระหนักถึงความปลอดภัยของข้อมูลตั้งแต่เริ่มต้นการรวบรวมและประมวลผลข้อมูล บ่อยครั้งที่เมื่อไม่มีปัญหาเกิดขึ้น เรากลับไม่ได้ตระหนักถึงความสำคัญของความปลอดภัยของข้อมูล แต่หากเกิดการรั่วไหลของข้อมูล ความเสียหายอาจมหาศาล การละเมิดข้อมูลอาจเกิดขึ้นเนื่องจากปัญหาทางเทคนิคหรือการโจมตีโดยเจตนาเพื่อขโมยข้อมูล เมื่อข้อมูลถูกละเมิด บุคคลหรือองค์กรอาจถูกนำไปใช้เพื่อวัตถุประสงค์ที่ผิดกฎหมายโดยผู้ไม่หวังดี ในขณะที่ธุรกิจอาจได้รับความสูญเสียทางการเงินจากการแก้ไขปัญหาที่เกี่ยวข้อง และอาจสร้างความเสียหายต่อแบรนด์
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

ดร. เดา ดึ๊ก มินห์ และทีมงาน VinBigdata ในงานกิจกรรม

เอ็นวีซีซี

หลังจากความมุ่งมั่นในการเชี่ยวชาญเทคโนโลยีเพื่อให้บริการชาวเวียดนามแล้ว จำเป็นต้องมีขั้นตอนเพื่อก้าวสู่ระดับโลกหรือไม่? องค์กรหรือบริษัทใดๆ ที่ต้องการนำผลิตภัณฑ์ออกสู่ตลาดต่างประเทศต้องปฏิบัติตามมาตรฐานสากล VinBigdata มีจุดแข็งด้านโซลูชันและเทคโนโลยี ดังนั้นการกำหนดวิสัยทัศน์ที่จะครองโลกจึงเป็นเรื่องธรรมชาติ แน่นอนว่าการจะนำไปปรับใช้กับผลิตภัณฑ์และแอปพลิเคชันที่หลากหลายนั้น จำเป็นต้องมีความร่วมมือจากหน่วยงานระหว่างประเทศที่มีประสบการณ์ยาวนานหลายปีและความเข้าใจในผู้ใช้ทั่วโลก ขอบคุณ!

Thanhnien.vn

ที่มา: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

การแสดงความคิดเห็น (0)

Simple Empty
No data

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

สรุปการอบรม A80 : กองทัพเดินเคียงข้างประชาชน
วิธีแสดงความรักชาติที่สร้างสรรค์และเป็นเอกลักษณ์เฉพาะตัวของคนรุ่น Gen Z
ภายในสถานที่จัดนิทรรศการครบรอบ 80 ปี วันชาติ 2 กันยายน
ภาพรวมการฝึกอบรม A80 ครั้งแรกที่จัตุรัสบาดิญ

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์