Pablo Haya Coll
Investigador del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid (UAM) y director del área de Business & Language Analytics (BLA) del Instituto de Ingeniería del Conocimiento (IIC)
SEAMLESSM4T es un sistema de traducción automática multilingüe y multimodal que combina capacidades de traducción de habla a habla (S2ST), habla a texto (S2TT), texto a habla (T2ST) y texto a texto (T2TT) para un rango muy amplio de idiomas, incluyendo lenguas de pocos recursos. SEAMLESSM4T logra una mayor precisión y robustez que los sistemas de traducción tradicionales. Las métricas reportadas indican que el modelo es resistente al ruido y a variaciones en los hablantes.
Es interesante destacar que el modelo incorpora estrategias para mitigar sesgos de género y toxicidad, garantizando traducciones más inclusivas y seguras. SEAMLESSM4T representa un paso adelante en la construcción de sistemas inclusivos y accesibles, ofreciendo un puente efectivo entre culturas y lenguajes para su aplicación en contextos tanto digitales como presenciales.
Aunque SEAMLESSM4T es un avance significativo, tiene algunas limitaciones reseñables. Su acierto varía según el idioma, especialmente en lenguas de bajos recursos, y según el género, acento y demografía. Puede enfrentar dificultades al traducir nombres propios, jerga y expresiones coloquiales.
Hay que tener en cuenta que el habla no se limita a ser texto hablado; incorpora una variedad de componentes prosódicos, como el ritmo, el énfasis, la entonación y el tono, así como elementos emocionales que requieren una investigación más exhaustiva. Para desarrollar sistemas S2ST que resulten orgánicos y naturales, es fundamental centrar los esfuerzos en que el audio generado preserve la expresividad del lenguaje.
Además, para aumentar la adopción de estos sistemas es preciso mayor investigación en sistemas que permitan traducción en streaming, es decir, traducir de forma incremental una oración a medida que se pronuncia.
Finalmente, los propios autores destacan que las aplicaciones impulsadas por SEAMLESSM4T deben entenderse como herramientas de apoyo diseñadas para asistir en la traducción, en lugar de reemplazar la necesidad de aprender idiomas o contar con intérpretes humanos confiables. Este recordatorio resulta especialmente crucial en contextos como la toma de decisiones legales o médicas.