위의 내용은 VinBigdata의 과학 책임자인 Vu Ha Van 교수가 최근 ViGPT 출시 행사의 sidelines에서 기자들과의 토론에서 공유한 내용입니다.
ViGPT에는 기술 인력과 커뮤니티의 기여가 필요합니다.
부하반 교수는 구글과 같은 대기업의 경우 주요 언어를 개발할 때 영어나 프랑스어를 주요 언어로 선택한다고 말했습니다. 베트남어도 있지만, 다른 언어에 비해 검색 결과나 조회가 비교적 느립니다. 어느 정도까지, 이러한 대규모 언어 모델이 베트남어 질문에 대한 답변은 완전하고 정확하지 않을 수 있습니다.
따라서 VinBigdata는 시간이 지남에 따라 ViGPT가 문화, 역사, 지리 등 베트남 사람들에게 고유한 특성과 속성을 지닌 정보와 직접적으로 관련된 질문에 대한 정확도 면에서 ViGPT를 앞지르기를 기대합니다. 이것이 바로 베트남어 모델을 만든 사람들이 앞으로 베트남 사람들에게 질문할 때 원하고 목표로 삼는 것이며, 외국어보다 더 나은 비교 자료가 될 것입니다.
더 깊이 들어가 보면, VinBigdata의 과학 책임자는 예를 들어 Truong Sa와 Hoang Sa의 역사에 관한 "민감한" 정치적 시기에 대한 질문을 분석했는데, Google이나 OpenAI의 답변이 이 회사 창립자나 그 배후에 있는 사람들의 정치적 편견을 담고 있지 않다고 보장하는 것은 매우 어렵습니다. 베트남에는 다른 선택지가 있는데, 그 점도 생각해 보는 게 좋을 것 같아요.
"베트남인을 위한 대규모 언어 모델을 구축하는 목적은 베트남인에게 가장 좋은 답변을 제공하는 것입니다. 우리는 그들의 목적을 알 수 없습니다."라고 Vu Ha Van 교수가 말했습니다.
물론, ViGPT가 현재 ChatGPT나 Google Bard만큼 잘 할 수 없는 일이 많이 있습니다. 이러한 사업의 투자 비율과 구현에 걸리는 시간이 ViGPT의 수천 배나 더 높기 때문입니다. 하지만 부 하 반 교수는 "6개의 황금 단어가 수놓아진 국기는 누구의 국기인가?"와 같이 베트남에 편향된 일부 질문에 대해서는 ViGPT가 Tran Quoc Toan의 것이라고 답할 수 있지만 다른 버전은 틀릴 수 있다고 말했습니다. 앞으로 이와 같은 심도 있는 질문을 통해 국내 사용자들의 피드백을 받으면 ViGPT가 더 나은 성과를 낼 수 있을 것입니다.
"만약 사용자들이 이 거대한 언어 모델을 비판하거나, 열 살짜리 아이가 모르는 질문을 알고 있거나, 우리가 AI보다 더 똑똑하다는 것을 증명하기 위해 속임수 질문을 던진다고 해서 이 거대한 언어 모델이 여전히 어리석다고 생각한다면, 우리는 AI보다 똑똑하지만, 그것은 어떤 목적을 위한 것이 아닙니다. 우리는 제품을 개선하는 것이 아니라, 제품을 만드는 사람들을 더 슬프게 만들 뿐입니다. 따라서 VinBigdata는 기술 전문가와 커뮤니티의 공동 기여가 필요합니다. 또한, 제품을 완성하는 데 있어 베트남 사람들의 협력이 필요합니다. 그래야 단순한 서비스 도구가 아닌 베트남 사람들의 자부심이 될 수 있습니다."라고 Vu Ha Van 교수는 강조했습니다.
베트남어 모델 지원 및 동반 준비 완료
VietNamNet 과의 인터뷰에서 베트남에서 AI를 개발하는 스타트업 대표들은 VinBigdata의 베트남어 모델을 지원하고 동반할 준비가 되었다고 말했습니다.
Aicontent.vn 플랫폼 소유주인 유니콘 주식회사의 기술 이사인 딘 트란 투안 린 씨는 현재 아시아에서는 자체적으로 대규모 언어 모델을 성공적으로 훈련하려는 노력을 기울이는 국가가 많지 않으며, 중국, 한국, 일본이 선두를 달리고 있다고 말했습니다. 따라서 ViGPT는 베트남 국민이 핵심 기술에 투자하려는 노력에 대한 중요한 신호입니다. 딘 쩐 투안 린 씨에 따르면, 천 리 길도 첫걸음부터 시작해야 한다고 합니다. AI 응용 분야의 선구자인 유니콘은 적절한 규모의 일부 프로젝트에서 ViGPT를 실험적으로 사용하고, 테스트하고, 피드백을 제공하고, 심지어 기여할 의향이 있습니다.
한편, Lovinbot의 공동 창립자인 당 후 손(Dang Huu Son) 씨는 VinBigdata가 커뮤니티와 전문가의 의견을 경청하는 것은 베트남인을 위한 대규모 언어 모델을 개발하는 데 매우 유용한 일이라고 말했습니다. 기술자인 Dang Huu Son 씨는 또한 제품을 사용한 후 VinBigdata의 기술팀에 피드백을 제공했습니다.
당 후 손 씨에 따르면, 새로 출시한 제품은 당장 완성할 수 없지만, 커뮤니티의 전폭적인 지원을 당장 받을 수도 없습니다. 베트남 사람들은 오래전부터 베트남은 그런 기술을 할 수 없다고 생각해 왔고, 아직 시간이 필요하다고 생각하기 때문입니다. 동시에 VinBigdata는 커뮤니티가 서로를 더 잘 지원하고 동행할 수 있는 방법에 대한 구체적인 지침이 필요합니다.
마인드메이드 플랫폼의 창립자인 당 후 록(Dang Huu Loc) 씨는 현재 전 세계적으로 모국어 모델을 구축한 국가가 매우 적다고 말했습니다. 인도처럼 정보기술이 강한 부유한 나라나, 인도네시아, 중동처럼 베트남보다 GDP가 높은 나라도 단지 하고 싶다고 해서 할 수 있는 것은 아니다. 언어적 특성에 따라서도 달라지기 때문이다. 따라서 더 넓은 관점에서 볼 때, 베트남은 대규모 토착어 모델을 구축하는 데 있어 전략적 이점을 가지고 있으며, 이는 베트남 사람들이 전 세계적으로 경쟁하는 데 있어 전략적 이점이 될 것입니다.
당 후 록 씨에 따르면, 대규모 베트남어 모델을 구축하려는 모든 노력은 가치 있고, 현재의 단점을 이용해 국내 기술 단위의 모든 노력을 무시하는 대신, 모델을 매일 더욱 완전하게 만들기 위해 특정 방식으로 의견을 제시해야 합니다. 베트남 국민도 AI 시대에 대언어 기술의 중요성에 대해 더 널리 알리고, 이를 적용하여 자신과 베트남 기업에 가치를 창출하는 방법에 대해 더 많이 논의해야지, 베트남 대언어 모델을 오늘날 세계 최고의 대언어 모델과 비교하는 데 그쳐서는 안 됩니다. 큰 언어는 일반적인 AI이기 때문에 어떤 문제에는 적합하지 않을 수 있지만, 다른 특정 문제에는 적합할 수 있습니다. 특히, 베트남어 대언어 모델은 베트남어를 이해하고 생성하는 것과 관련된 문제에서 더 나은 이점을 가질 것입니다.
[광고_2]
원천
댓글 (0)