Als er inmitten des Trubels der von einer Geschäftsreise zurückkehrenden Menschen die Flughafenlobby betrat, hielt Ho Minh Duc einige Sekunden inne, als er eine vertraute, sanfte Frauenstimme hörte, die eine Durchsage über das System vorlas.
Die Mitarbeiter von Vbee arbeiten in der Firmenzentrale in Hanoi – Foto: NVCC
Er lächelte und fühlte sich erleichtert und glücklich, als hätte er einen Verwandten wiedergetroffen. Dieser „Verwandte“ ist eine von 20 KI-Stimmen, mit denen Duc und das Vbee-Team viele Tage und Monate „gegessen und geschlafen“ haben, wobei sie ihr ganzes Herzblut in jede Tonlinie gesteckt und auf jede Nuance der Stimme geachtet haben, um sie immer natürlicher und menschlicher zu machen.
Holpriger Start
Ich weiß nicht, wie oft CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründer der Vbee Data Solutions and Services Joint Stock Company – ein solches Gefühl der Freude und des Stolzes erlebt haben.
Sie trafen in vielen verschiedenen Situationen auf „besondere Bekanntschaften“: klare Stimmen aus Schullautsprecheranlagen, warme Stimmen in Gebäuden oder professionelle Stimmen aus den automatischen Telefonzentralen vieler Unternehmen.
Die Geistesprodukte von Vbee sind nicht mehr nur das Ergebnis von Algorithmen und Codes, sondern werden tatsächlich zum Leben erweckt und leisten stille, aber wirkungsvolle Beiträge in vielen Bereichen.
Von Buchvorstellungen über Filmsynchronisationen bis hin zu automatisierten Callcenter-Ansagen – Vbee haucht der Sprachtechnologie neues Leben ein.
Als „Mutter“ der TTS-Kerntechnologie ist Dr. Nguyen Thi Thu Trang stets bestrebt, Produkte der vietnamesischen Sprachsynthesetechnologie – der Technologie, der sie seit ihrer Doktorarbeit an der Universität Paris 11 viel Arbeit gewidmet hat – den echten Benutzern zugänglich zu machen.
Die Anfangszeit von Vbee war voller Härten. Obwohl die Text-to-Speech-Engine (TTS) in den ersten beiden Jahren kostenlos war, konnte sie nur eine kleine Gruppe von Benutzern ansprechen. Doch dann stellte sich COVID-19 als unerwarteter Wendepunkt heraus.
Angesichts strenger Vorschriften zur sozialen Distanzierung müssen Unternehmen wie FE Credit, Momo, Viet Credit, Sacombank usw. Wege finden, Tausende von Kunden zu erreichen. Dann kam Vbee ins Spiel: Von Schuldenerinnerungen bis hin zu automatisierten Antworten wurde ihr Produkt schnell zur optimalen Lösung. Damals machten virtuelle Assistenten und virtuelle Agenten 80 % des Umsatzes von Vbee aus.
Als die Pandemie vorüber war und die Weltwirtschaft zusammenbrach, stand Vbee vor neuen Herausforderungen. Die Welle der generativen KI (GenAI) und die Trends im Bereich digitaler Inhalte haben TTS-Engines wiederbelebt. Heute sind die KI-Stimmen von Vbee überall zu hören, von TikTok über YouTube bis hin zu Facebook.
„Viele der heutigen TTS-Inhalte werden von uns bereitgestellt“, teilte Herr Ho Minh Duc stolz mit. Derzeit liegt die tatsächliche Benutzerbasis von Vbee bei über 2 Millionen und diese Zahl steigt weiterhin jeden Monat stetig um 20 %.
Vbee hat über 20 hochwertige Unternehmensstimmen trainiert und, wenn man benutzerdefinierte Stimmen mitzählt, über 200 verschiedene KI-Stimmen erstellt.
Mit der neuen Sprachtranskriptionstechnologie, die kürzlich erforscht und getestet wurde, sind zum Trainieren einer neuen Stimme jetzt nur noch 3 Minuten aufgezeichneter Daten erforderlich, statt wie vor zwei Jahren noch 4 bis Dutzende Stunden Aufzeichnung.
CEO Ho Minh Duc und Chief Technology Officer Nguyen Thi Thu Trang – zwei Gründer der Vbee Data Solutions and Services Joint Stock Company – Foto: NVCC
„Wir verstehen Vietnamesisch besser“
Im Wettlauf um die Sprachsynthesetechnologie sieht CEO Ho Minh Duc eine Zeit, in der die Bemühungen um technologische Innovationen allmählich an ihre Grenzen stoßen werden.
Ihm zufolge entwickelt Vbee nicht nur eine Kerntechnologie zur Verarbeitung vietnamesischer Sprache, sondern baut auch ein Technologiesystem auf, das in der Lage ist, die vietnamesische Sprache gründlich zu verstehen – mit all ihren Feinheiten, Tönen und der einzigartigen Kultur, die nur echte Vietnamesen vollständig verstehen können.
Als Marktführer im TTS-Markt in Vietnam sind die beiden Leiter von Vbee davon überzeugt, dass ihr Tool zum Standard für KI-gestütztes Vorlesen von Texten für Vietnamesisch geworden ist. Benutzer schätzen nicht nur die Genauigkeit, sondern spüren auch die „Emotion“ in jeder von Vbee entwickelten Stimme.
Im Vietnamesischen beispielsweise hat allein das Wort „Gasse“ je nach Region viele verschiedene Namen, etwa „hèm“, „kiệt“, „xếc“ – jedes Wort hat eine andere Nuance, die die KI verstehen muss.
Um dies zu erreichen, hat Vbee massiv in das Sammeln von Beispieldatensätzen sowie in leistungsstarke Serversysteme für das KI-Training investiert.
„Damit die KI jede regionale Nuance richtig verstehen und verarbeiten kann, mussten wir unzählige Beispielsätze erstellen und die Kosten für den Verarbeitungsserver waren zudem sehr hoch“, erklärte CEO Ho Minh Duc.
Dr. Nguyen Thi Thu Trang hat mehr als 15 Jahre damit verbracht, die TTS-Kerntechnologie von Vbee zu erforschen, um die Töne und Grammatikmerkmale des Vietnamesischen zu entschlüsseln. Für sie ist ihre Muttersprache eine subtile Welt voller ausdrucksstarker Nuancen.
„Meine vietnamesische Sprache ist sehr komplex und interessant, die Töne sind die schwierigsten und unterscheiden sich von vielen anderen populären Sprachen der Welt. Je besser ich die Sprache verstehe, desto genauer wird mein Modell sein“, erklärte sie.
Vbee behauptet allmählich, dass sie im Technologiezeitalter ein unverzichtbarer Bestandteil von Tools und Geräten mit integrierter vietnamesischer Sprachverarbeitungssoftware sein werden.
Das Vbee-Team erforscht und entwickelt nicht nur Technologie in jedem Wort und jeder Stimme, sondern ist auch bestrebt, in seinen KI-Stimmen eine echte „vietnamesische Emotion“ zu erzeugen.
Der Name Vbee ist eine Abkürzung des Satzes „Vietnamese BE your Eyes“ (Vietnamesisch: Sei deine Augen) und entstand aus meinem ursprünglichen Wunsch, ein Werkzeug zu bauen, das zu den „Augen“ von Sehbehinderten wird. Aber angesichts des aktuellen Entwicklungstrends, bei dem viele Menschen lieber zuhören als sehen möchten, glauben wir, dass Vbee auch zum „Auge“ aller werden wird.
Dr. Nguyen Thi Thu Trang (Dozentin, School of Information Technology, Hanoi University of Science and Technology, Gründerin und Technologiedirektorin der Vbee Company)
Treffen der Hörbuchliebhaber
Vbee entstand aus dem Schicksal von Dr. Nguyen Thi Thu Trang mit der Blindengemeinschaft. Seit ihrer Studienzeit beteiligt sie sich an der Aufnahme von Hörbüchern und der Entwicklung vietnamesischer Leseprogramme zur Unterstützung von Sehbehinderten.
Diese Erfahrungen inspirierten sie zur Entwicklung einer vietnamesischen Lesesoftware – dem Vorgänger von Vbee. Im Jahr 2018 gründete sie zusammen mit Herrn Ho Minh Duc – einem Kommilitonen an der Hanoi University of Science and Technology mit Erfahrung aus dem Socbay.com-Projekt und der Digitalisierung von Hörbüchern – Vbee, einen Pionier auf dem Gebiet der Text-to-Speech-Konvertierung in Vietnam.
Vbees herausragende Erfolge
- Erster Preis der Qualcomm Vietnam Innovation Challenge 2024
- Sonderpreis Tuoi Tre Start-up Award 2023
- Gewinner-Start-up im Grab Venture Ignite 2020 Accelerator-Programm
- Erster Preis des vietnamesischen Talents 2018, zweiter Preis des vietnamesischen Talents 2020
- Zertifikat für vietnamesische Kerntechnologie im Nationalen Programm zur digitalen Transformation 2025 – 2030 des Ministeriums für Information und Kommunikation
– Gewinnerprojekt beim Vietnam Digital Media Award 2018 und Vingroup Fund 2019.
Regionale Vision
Nachdem Vbee seine Position auf dem vietnamesischen Markt gefestigt hat, strebt das Unternehmen eine Expansion nach Südostasien an und plant, seine TTS-Technologie bis 2026 in Länder wie Laos, Thailand, Kambodscha und die Philippinen zu bringen.
Laut Dr. Nguyen Thi Thu Trang wird der schnelle technologische Fortschritt mit der Entstehung mehrsprachiger Modelle die Entwicklung von TTS-Tools für andere Sprachen erleichtern.
Derzeit erforscht sie Sprachtechnologien für Thailändisch, Chinesisch und Englisch und eröffnet Vbee damit neue Möglichkeiten auf dem internationalen Markt.
[Anzeige_2]
Quelle: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Kommentar (0)