Hace 1 año | Por ccguy a genbeta.com
Publicado hace 1 año por ccguy a genbeta.com

VALL-E (no confundirla con DALL-E) es un modelo de lenguaje capaz de generar audio con la misma voz y entonación que el interlocutor. Lo único que necesita la herramienta es un audio de como mínimo tres segundos para que pueda comenzar a procesar. Las capacidades de este modelo de lenguaje quedan detalladas en el informe publicado por los investigadores. VALL-E ha sido entrenado con más de 60.000 horas de audios en inglés. A través de esta tecnología el usuario puede sintetizar un audio personalizado a partir de la voz de una persona distinta.

Comentarios

D

Tus padres adoptivos están muertos.

Pacman

#6 Es usted una persona de cultura

t

Si le ponen tres segundos de Feijóo involucionará hasta un Loquendo.

D

#2 lol lol,

S

Será de bastante ayuda para perfeccionar timos donde ahora, en vez de mandarte un SMS pidiéndote dinero un familiar, te podrá llamar directamente por teléfono con su voz auténtica

¿Qué sería de este mundo sin todas las contribuciones de Microsoft?

S

#3 Algo así

D

#3 Un mundo con Linux de Escritorio todos los días 🌈

#3 El timo de la llamada ya existe, esto lo va a llevar a otro nivel.

NPC1

#13 Eso te pasa por coger el número de telefono a desconocidos, yo como no lo cojo, no me pasa

M

#3 Claro, es como que nos enojemos con el agua porque hay gente que muere ahogada.

Muy inteligente el racionamiento.

S

#15 El agua no la inventó nadie, pero tiene muchos usos positivos.

Algo que sirve para hacerse pasar por otras personas, como esto, todavía no se me ocurre en qué va a mejorar la humanidad.

D

Si mezclas esto con chat.openai tendrás en breve call centers totalmente automatizados que, aunque no fuesen estafas, te podrían dar información errónea o contradictoria.
Si lo juntas con generación de vídeo por IA puedes tener videollamadas de familiares pidiéndote dinero de manera desesperada.
No se me ocurre una forma fácil de diferenciar una llamada legítima de una maliciosa.
Se vienen malos tiempos.

Pacman

#9 Habrá que tener claves familiares, tipo... Que licor bebiste en la nochevieja del 2005 que te dejó todo tumbao.
O cosas así

MAVERISCH

#9 Quizás preguntando: ¿Eres un humano o una IA?

ccguy

¿Algún@admin me lo puede mover a tecnología?

BenjaminLinus

#1 Yo, como superadmin todopoderoso podría hacerlo, pero ahora no tengo ganas. Que te lo haga otro.