Con la integración de PaLM 2, un modelo de lenguaje de gran tamaño, Google está utilizando la Inteligencia Artificial (IA) para ampliar la variedad de idiomas soportados por el Traductor de Google. Esta incorporación de 111 nuevos idiomas abarca más de 660 millones de hablantes, lo que equivale a traducciones para cerca del 8% de la población mundial.
Estos nuevos idiomas incluyen desde grandes lenguas con más de 100 millones de hablantes hasta lenguas indígenas habladas por pequeñas comunidades. Alrededor de una cuarta parte de los nuevos idiomas provienen de África, marcando la mayor expansión de lenguas africanas hasta la fecha, con idiomas como fon, kikongo, luo, ga, swati (o suazi), venda y wólof.
Algunos de los idiomas recientemente añadidos incluyen:
- Afar: Una lengua tonal hablada en Yibuti, Eritrea y Etiopía, destacada por recibir una gran cantidad de aportes de la comunidad de voluntarios.
- Cantonés: Un idioma solicitado durante mucho tiempo, difícil de incorporar debido a su superposición con el mandarín en la escritura.
- Manés: La lengua celta de la Isla de Man, revitalizada después de casi desaparecer.
- N'Ko: Una lengua estándar de las lenguas mandingas de África Occidental, con un alfabeto único inventado en 1949.
- Punjabi (Shahmukhi): El tipo de escritura en alfabeto perso-árabe (Shahmukhi), el idioma más hablado en Pakistán.
- Tamazight: La lengua bereber del norte de África, escrita tanto en alfabeto latino como en Tifinagh.
- Tok Pisin: Un criollo basado en el inglés y la lengua franca de Papúa Nueva Guinea.
Agregar nuevos idiomas al Traductor de Google implica considerar diversos factores, desde qué variedades ofrecer hasta qué ortografías usar. Muchos idiomas presentan variaciones significativas, como dialectos regionales y diferentes reglas de ortografía. Google prioriza las variedades más utilizadas de cada idioma para maximizar la accesibilidad y la utilidad de las traducciones.
Por ejemplo, el romaní tiene múltiples dialectos en Europa. Los modelos de Google generan texto que se asemeja al romaní vacalo del sur, una variedad común en Internet, aunque también incluye elementos de otros dialectos.
Colaboración y futuro
Gracias a las alianzas con lingüistas expertos y hablantes nativos, Google sigue avanzando en este campo. A medida que la tecnología evoluciona, Google se compromete a seguir ampliando el soporte para más variedades gramaticales y reglas ortográficas, promoviendo así la inclusión y la diversidad lingüística en su plataforma de traducción.
Esta expansión refleja el compromiso continuo de Google para hacer del mundo un lugar más conectado y accesible, eliminando las barreras del idioma y acercando a las personas de todas las comunidades.
Compartinos tu opinión