Las estafas con voces de IA están en aumento. Aprende a identificarlas y protegerte de los deepfakes de audio.
Las estafas telefónicas han evolucionado con el avance de la inteligencia artificial (IA); La tecnología de IA generativa permite a los ciberdelincuentes crear audios falsos que imitan con gran precisión la voz de una persona.
Este método, conocido como deepfake de audio, se ha convertido en una herramienta popular para suplantar identidades, cometer fraudes financieros, robar cuentas o manipular a las víctimas a través de engaños telefónicos.
Especialistas en ciberseguridad de ESET advierten que las voces generadas por IA han facilitado la creación de fraudes más complejos y difíciles de detectar.
Con solo unos segundos de grabación de una voz real, los atacantes pueden generar un audio artificial que suena muy similar al original, haciendo más fácil engañar a las personas durante una llamada telefónica.
Estas estafas a menudo comienzan seleccionando a una víctima cuya voz sea fácil de obtener en internet. Los objetivos suelen ser figuras públicas, directivos de empresas o incluso personas comunes que publican contenido en redes sociales o participan en entrevistas, videos o conferencias en línea.
Identificación
Los expertos señalan que hay señales para identificar una llamada generada con IA. Una de las más comunes es un ritmo de voz extraño o poco natural. Aunque la tecnología ha mejorado, a veces el habla puede sonar ligeramente artificial.
Otro indicio es la falta de variaciones emocionales en la voz. Los sistemas de generación de audio pueden reproducir palabras con precisión, pero a veces les cuesta transmitir emociones de manera convincente.
Los patrones de respiración también pueden delatar un audio generado artificialmente. Algunas grabaciones pueden incluir pausas inusuales, frases demasiado largas sin respiración o patrones respiratorios poco realistas.
En los deepfakes menos sofisticados, es posible percibir un tono ligeramente robótico o metálico. Además, el sonido ambiente puede resultar sospechoso: un silencio total o un ruido de fondo demasiado uniforme pueden indicar que la llamada no proviene de un entorno real.

