Si parpadean, se lo van a perder | ARP Sociedad para el Avance del Pensamiento Crítico

Por admindrupal, 6 Abril, 2024

Sección

ARTÍCULOS

Traductores

Pagina final

Recomendamos la lectura de este artículo en formato pdf, respetando su maquetado original.
Para ello pinche en la imagen de la primera página que aparece arriba.
Para facilitar su difusión, proporcionamos también la versión del artículo en html y texto, pero tenemos que advertirle que su extracción ha sido realizada por herramientas automáticas y puede que no conserve completamente la composición original.

Enlace al artículo en html (en nueva ventana): Si parpadean, se lo van a perder
Texto plano (desmaquetado) del artículo : Mostrar el texto plano (segunda vez esconde)

Si parpadean,
se lo van a perder
Emilio J. Molina

ARP-Sociedad para el Avance del Pensamiento CrÃtico

Sobre inteligencia artificial y desinformaciÃ³n

ace casi exactamente un aÃ±o charlÃ¡bamos
en EscÃ©pticos en el Pub Madrid1 sobre los
(entonces) emergentes deep fakes, y cÃ³mo
iban a suponer un revulsivo en la cantidad
de desinformaciÃ³n a la que estaremos expuestos. El
nÃºcleo de la charla era, bÃ¡sicamente, que la manipulaciÃ³n audiovisual de la informaciÃ³n no es nada nuevo
y que no hay mÃ¡s que comprobar las aparentemente
inevitables cadenas de Whatsapp para comprobar que
ni siquiera es necesaria sofisticaciÃ³n alguna para que
los bulos se difundan a sus anchas. Sin embargo, los
nuevos avances en inteligencia artificial (IA) vienen a
subir la apuesta sobre el problema, hipersofisticando
la calidad y persuasiÃ³n del engaÃ±o.
En un alarde de dotes clarividentes, comentaba yo
en la charla que los que tenÃan en ese momento las
herramientas mÃ¡s avanzadas no las habÃan liberado

aÃºn al pÃºblico, en un ejercicio de autocontrol y Ã©tica
para no desatar a la bestia sin tener claro cÃ³mo (o si
se podÃa) domesticarla. Creo que fue cuestiÃ³n de dos
semanas tras la charla que algunos de estos modelos
pasaran a formar parte del cÃ³digo publicado en repositorios al alcance de todo el mundo.
En ese momento, hace un aÃ±o, insisto, habÃamos
pasado a su vez desde algo que nos parecÃa imposible
(que un ordenador nos generara una imagen realista
por su cuenta) a algo que, mÃ¡s o menos rudimentario,
ya llegaba al nivel de hacernos dudar (y, en ocasiones,
a colÃ¡rnosla).
Pero esto es el mundo de la informÃ¡tica y, como
muchos saben, aquÃ funcionan a menudo las leyes de
evoluciÃ³n cuadrÃ¡tica. Los avances van siendo exponenciales, y donde el aÃ±o pasado aÃºn tenÃamos trucos
de Blade Runner tan toscos como fijarnos en cuÃ¡ntos

Es fÃ¡cil ser escÃ©ptico de aquello que
nos suena mal, pero muy difÃcil que
no nos cuelen aquello que ya estamos
predispuestos a creer. Subid el volumen de
la desconfianza ante esto Ãºltimo

el escÃ©ptico 50

Invierno 2024

�Imagen de Tung Nguyen en Pixabay

dedos les ponÃan estas IA a las manos, este aÃ±o necesitamos recurrir a asuntos muchÃsimo mÃ¡s sofisticados
(en la charla se desgranaban algunos). Donde el aÃ±o
pasado el problema era mÃ¡s a nivel de imÃ¡genes fijas o de vÃdeos no muy complejos, este aÃ±o tenemos
hiperresoluciones animadas prÃ¡cticamente perfectas.
Pero aÃºn hay mÃ¡s. Mucho mÃ¡s.
Durante agosto, Ãlex2, un colega de profesiÃ³n que
se encarga de los fantÃ¡sticos Deep Fakes del programa de televisiÃ³n El Intermedio, querÃa probar en el
grupo de chat de Telegram de El Mundo Today una
nueva tecnologÃa de conversiÃ³n de voz, en la que le
pasas un audio cualquiera a una IA alimentada con
los audios de la persona a la que quieres imitar, y te
devuelve tu mismo audio con su timbre. En este grupo, Kike GarcÃa, uno de los creadores de EMT, lleva
un tiempo enviando notas de voz de unos diez minutos a modo de parodia de los tÃpicos audios insulsos
que muchos recibimos a veces, a los que ha terminado dando forma de monÃ³logos. Aprovechando sus
vacaciones (las del propio Ãlex y las de Kike), nos
pidiÃ³ a los miembros del canal que mandÃ¡ramos audios breves, que Ã©l usarÃa para intentar transformar en
la voz de Kike. Incluso siendo una tecnologÃa reciente
que mi colega aÃºn estaba tratando de domesticar, los
resultados fueron apabullantes. A poco que la persona
copiara sus modismos (y no tuviera acentos muy reconocibles, que ahÃ se veÃan fÃ¡cilmente las costuras), los
audios tenÃan una similitud pasmosa. Y hablamos de
una voz que, por lo comentado (y por sus divertidos
contenidos audiovisuales), estamos acostumbrados a
oÃr.
En la charla ya comentÃ© que, probablemente, los
deep fakes de audio vayan a convertirse en una herramienta mucho mÃ¡s peligrosa que los de vÃdeo, por
el hecho de que en vÃdeo aÃºn hay muchos parÃ¡meInvierno 2024

tros que nos pueden dar una pista de que algo falla
(dientes moviÃ©ndose, sombras no exactamente en su
sitio, ciertos desenfoquesâ¦), mientras que en un audio contamos con muchas menos pistas. Y parte del
problema tambiÃ©n es que estas modificaciones, si no
se dan ya, estÃ¡n a un paso de poderse hacer en tiempo
real. Imaginad quÃ© significa esto para asuntos como el
phishing y otros tipos de estafas que actualmente se
hacen vÃa texto con mucha menor sofisticaciÃ³n (el dÃa
que los ciberdelincuentes aprendan a escribir sin faltas de ortografÃa, el mundo serÃ¡ un lugar mucho mÃ¡s
inseguro; al menos, para quienes sepan detectarlas).
Por si fuera poco, la apariciÃ³n de herramientas
como ChatGPT ha venido a lanzar un Ã³rdago muchÃsimo mayor si cabe. Pero este es un tema tan inmenso
que excede de lo que querÃa tratar en el artÃculo, mÃ¡s
allÃ¡ de que se puede usar para generar desinformaciÃ³n
de forma muy rÃ¡pida y con un grado de calidad superior a la media.
La charla de EscÃ©pticos en el Pub se grabÃ³ con una
calidad de sonido bastante pobre, por desgracia. Pero
apenas unos meses tras la charla, tambiÃ©n aparecÃan
herramientas como Whisper3, de la misma OpenAI
que liberÃ³ algunos de los modelos comentados, y que
permite una transcripciÃ³n a texto de bastante calidad.
Espero que cuando lean estas lÃneas ya haya sacado
tiempo para aÃ±adir subtÃtulos a la charla y que podÃ¡is
comprobar cÃ³mo ha envejecido en solo un aÃ±o (por
ejemplo, con los recientes vÃdeos virales de traducciones a otros idiomas con la misma voz del original).
No es casualidad que haya algunos productos audiovisuales como el recomendable podcast Titania4 y
la espectacular Mission Impossible: Sentencia Mortal
(Parte 1)5, donde este tipo de avances, mucho mÃ¡s cercanos de lo que nos sentiremos cÃ³modos de reconocer, forman parte fundamental de la trama.
Os dejo dos consejos de gurÃº clarividente (disclaimer: vÃ©ase el segundo pÃ¡rrafo):
1. No gastÃ©is dinero en cursos de prompt engineer
ni cosas asÃ; estÃ¡ avanzando todo a tal velocidad que
la semana que viene podrÃan no tener ya sentido.
2. Es fÃ¡cil ser escÃ©ptico de aquello que nos suena
mal, pero muy difÃcil que no nos cuelen aquello que
ya estamos predispuestos a creer. Subid el volumen
de la desconfianza ante esto Ãºltimo, mÃ¡xime cuando
vuestros hijos os pidan dinero porque les han robado
el mÃ³vil o un prÃncipe nigeriano os llame en persona
para nosequÃ©.
Notas:
1. https://www.escepticos.es/node/8563
2. https://twitter.com/thehardmenpath
3. https://openai.com/research/whisper
4. https://www.ivoox.com/podcast-titania_sq_
f11946762_1.html
5. https://www.filmaffinity.com/es/film945258.html
51 el escÃ©ptico

autores

El Escéptico Digital

Página inicial