El desarrollador en software y especialista en inteligencia artificial Gabriel Sosa presentó un detallado análisis técnico sobre los audios atribuidos a la consejera del CNE, Cossette López, utilizando modelos avanzados de Machine Learning y detección de DeepFakes.
Su conclusión fue contundente: los audios son auténticos y no presentan rastros de manipulación ni generación por inteligencia artificial.
Modelo entrenado con base científica y tecnológica
Según explicó Sosa, su modelo de detección de anomalías fue entrenado con el DataSet de Meta (Facebook AI), parte del programa DeepFake Detection Challenge (DFDC), que contiene miles de videos y audios reales y falsos empleados por investigadores de todo el mundo para entrenar sistemas de verificación.
El experto señaló que su algoritmo se basa en una arquitectura CNN-LSTM (Red Neuronal Convolucional y de Memoria a Corto Plazo), diseñada específicamente para analizar patrones acústicos imposibles de replicar por IA generativa.
Detalles del análisis técnico
- Extracción espectral (CNN): El modelo analizó los espectrogramas del audio, identificando los patrones naturales de ruido ambiental y respiración humana.
- Análisis temporal (LSTM): Evaluó la fluidez de fonemas y transiciones en la voz, descartando “glitches” o tartamudeos sintéticos típicos de audios manipulados.
- Parámetros de tono (F0): El tono de voz mostró variaciones biológicas normales, sin la “aplanación” característica de clonaciones por IA.
- Ruido orgánico: Los silencios y pausas del audio revelaron un patrón caótico natural, propio de una grabación real y no de ruido digital simulado.
- Consistencia de amplitud: La onda de sonido mantuvo la irregularidad típica de una grabación con micrófono ambiental o de smartphone.
El sistema de clasificación de Sosa arrojó un 98.75% de autenticidad, un valor que califica como “extremadamente alto” dentro de los estándares de detección DeepFake.
Resultados: “No es un audio generado por IA”
“El modelo no solo clasificó el audio como real, sino que el score de autenticidad fue extremadamente alto. Los indicadores clave de manipulación DeepFake estuvieron ausentes”, publicó Sosa en su cuenta de X (antes Twitter), donde compartió los resultados y gráficos técnicos del proceso.
Machine Learning y autenticidad digital
En su publicación, Sosa explicó que el Machine Learning es un subcampo de la Inteligencia Artificial que permite crear algoritmos capaces de reconocer patrones y clasificar información a partir de datos de entrenamiento.
“Los avances en ML no solo crean DeepFakes, también nos dan las herramientas para detectarlos”, concluyó.
El peritaje digital realizado por Gabriel Sosa representa uno de los análisis más avanzados presentados hasta ahora sobre los audios de Cossette López, combinando ciencia de datos, ingeniería de sonido e inteligencia artificial.
Su modelo descartó manipulación o generación sintética, reforzando la conclusión de que los audios son auténticos y registran una firma acústica humana real, imposible de replicar con IA.