Samsung lidera en la creación de experiencias de inteligencia artificial (IA) premium para dispositivos móviles. Para entender cómo Galaxy AI está potenciando a sus usuarios, visitamos los centros de investigación de Samsung en todo el mundo. Galaxy AI, ahora compatible con 16 idiomas, permite que más personas expandan sus habilidades lingüísticas, incluso sin conexión, gracias a funciones como Traducción Simultánea, Intérprete, Asistente de Notas y Asistente de Navegación. Recientemente, exploramos en Jordania la complejidad del desarrollo de un modelo de IA para el árabe, un idioma con numerosos dialectos. Ahora, nos dirigimos a Vietnam para investigar cómo se preparan los datos para entrenar modelos de IA.
¿Cuál es la diferencia entre «fantasma», «tumba» y «madre» en vietnamita? Para un idioma hablado por 97 millones de personas en todo el mundo, la distinción es mínima. Cada término se traduce como «ma», «mả» y «má», respectivamente, y solo se diferencia por el tono. Esto ilustra los desafíos que enfrentan los modelos de IA al aprender un idioma, ya que carecen de la capacidad de comprender el contexto, las emociones y las intenciones en las conversaciones.
El Instituto de Investigación y Desarrollo de Samsung (SRV) en Vietnam utilizó datos minuciosamente revisados para ayudar a su modelo de IA a reconocer incluso las diferencias más sutiles en el lenguaje.
La calidad de los datos utilizados afecta directamente la precisión del reconocimiento automático de voz (ASR), la traducción automática neuronal (NMT) y la conversión de texto a voz (TTS), procesos que respaldan funciones de Galaxy AI como Traducción Simultánea, Intérprete, Asistente de Escritura y Asistente de Navegación, ayudando a superar las barreras del idioma.
«El vietnamita es un idioma complejo y diverso con expresiones ricas, muchas de las cuales son difíciles de capturar», explica Ngô Hồng Thái, líder de NMT en SRV. «Personalmente, ¡crear un modelo de IA para el idioma vietnamita fue más desafiante que nuestros tifones!» añade, refiriéndose a los obstáculos enfrentados durante el desarrollo del modelo.

El proceso de refinamiento de datos consta de tres pasos: revisión y corrección de audio y texto, controles aleatorios de calidad y normalización de datos antes del entrenamiento del modelo.
«Nos enfrentamos a problemas inesperados, como palabras mal escritas en guiones y ruido de fondo durante las grabaciones de audio», afirma Nguyen Manh Duy, líder de TTS en SRV. «Dedicamos mucho tiempo a perfeccionar y mejorar nuestros datos de entrenamiento».
Además de los desafíos lingüísticos únicos del vietnamita, la falta de datos universalmente accesibles también plantea dificultades. Para mejorar la precisión del modelo de IA, se recopilaron datos de diferentes regiones de Vietnam.
A pesar de los desafíos, el equipo de SRV completó el proyecto y el vietnamita se convirtió en uno de los primeros idiomas admitidos por Galaxy AI. Sin embargo, continúan trabajando para mejorar la experiencia con el idioma, incorporando comentarios de usuarios y explorando nuevas posibilidades.





