La empresa escribió esto en una publicación de blog. El modelo SeamlessM4T puede admitir traducción de texto a voz en casi 100 idiomas, así como traducción de voz a voz completa para 35 idiomas. Combine tecnologías que antes solo estaban disponibles en modelos separados.
El director ejecutivo, Mark Zuckerberg, dijo que imagina tales herramientas para facilitar las interacciones entre usuarios de todo el mundo en el metaverso. La publicación del blog revela que Meta pone el formulario a disposición del público para uso no comercial..
La empresa de redes sociales más grande del mundo ha lanzado este año varios modelos de IA, en su mayoría gratuitos, incluido un modelo de lenguaje a gran escala llamado Llama que plantea un serio desafío para OpenAI respaldado por Microsoft y los modelos propietarios comercializados por Google.
Según Zuckerberg, un ecosistema abierto de IA beneficiará a Meta, La empresa está preparada para lograr más mediante el crowdsourcing de herramientas de consumo para sus plataformas sociales.
Para el modelo SeamlessM4T, los investigadores de Meta dijeron en un artículo de investigación que recopilaron 4 millones de horas de «datos de entrenamiento de audio a partir de audio sin procesar de datos web rastreados y disponibles públicamente», sin especificar el repositorio. Un portavoz de Meta no respondió a las preguntas sobre el origen de los datos de audio.
Fuente de la imagen de portada: Getty Images
«Quiero ser un aficionado a la televisión. Entusiasta certificado de la cultura pop. Académico de Twitter. Estudiante aficionado».