La voz de María Fitó-Carreras es viva, clara y expresiva. Inició su carrera en la radio en 1992, y eso imprime carácter. Ahora, además de locutora profesional, productora de publicidad y asesora; es docente e investigadora de la Facultat de Ciències de la Comunicació de la Universitat Internacional de Catalunya. Está especializada en branded podcast.
Ella será la persona encargada de inaugurar Prosodia 2025 con una ponencia sobre la Inteligencia Artificial en el mundo del pódcast. En una voz autorizada en la materia. En esta entrevista aborda los desafíos de la IA en relación con el podcasting.
Vivimos obnubilados por la Inteligencia Artificial. ¿Es tan fiero el león?
El león va a ser tan fiero como le dejemos. Se trata de ir poniéndonos límites como sociedad y no permitir que se apodere de capacidades humanas complejas, como el pensamiento crítico. Con el resto de las habilidades que ya le hemos cedido estamos vendidos. Escuchamos que la Inteligencia Artificial jamás va a discernir entre lo bueno y lo malo o que no mostrará emociones. Quizás en mi adolescencia leyera demasiado a Asimov, pero ¿quién sabe si en un par de siglos la IA será la dueña de nuestro mundo y tendremos que pactar con ella unas reglas de convivencia? En todo caso, aquello que nos hace humanos no debería cederse a una tecnología tan alegremente, por más que ahora nos facilite el trabajo y nos haga más eficientes, porqué nos convierte en vulnerables.
¿Qué impacto está teniendo en el mundo del pódcast?
Como en todos los campos, el podcasting está aprovechando las ventajas de la Inteligencia Artificial para agilizar el trabajo de los creadores. Permite desde recopilar información, estructurar el pódcast o redactar el guion; hasta generar voces sintéticas para construir la narrativa, mejorar la calidad del audio, crear música, efectos de sonido y audiogramas, o transformar el audio en video; entre otras muchas posibilidades. La cuestión es con qué calidad y precisión lo hace y si, a la larga, puede llegar a ‘atrofiar’ nuestras capacidades humanas por no usarlas.
En un futuro cercano, ¿cree que ese impacto será mayor? ¿Sustituirá la IA a guionistas, periodistas o editores?
La revolución de la IA justo acaba de empezar. Si miramos hacia atrás, la última gran revolución tecnológica que tenemos como referencia, la industrial, se prolongó durante casi dos siglos. En la misma dirección, la IA irá superándose día a día y sorprendiéndonos constantemente con nuevas habilidades. Pero en un futuro cercano no veo que represente ninguna amenaza para estos puestos de trabajo. De momento no los sustituirá, sino que la IA los acompañará tal como está haciendo ahora.
¿Y las voces? ¿Son capaces las máquinas de transmitir como lo hace un ser humano?
Los actuales softwares de clonación de voz aun presentan limitaciones, especialmente relacionadas con la prosodia, es decir, la manera en que cada uno hablamos y que nos hace únicos. Todavía no logran transmitir el ADN del habla, ni mucho menos las emociones humanas. El verdadero problema es que lleguemos a normalizar esas voces vacías que, aunque sean perfectas y no se tropiecen nunca, no transmiten nada. Por otro lado, un pódcast sin emociones es un podcast ‘muerto’, porque no conecta con la audiencia. Pienso que en estos momentos producir un pódcast con voces sintéticas no aporta ningún beneficio en términos de conexión y, además, para el creador del contenido supone una gran inversión de tiempo.
Usted cómo ve el futuro de la IA generativa de voz. ¿Vaso medio vacío o medio lleno?
Imaginemos por un momento que, en cinco años, la IA sea capaz de replicar la prosodia humana y que las plataformas estén hasta los topes de pódcast creados con voces sintéticas, especialmente aquellos traducidos a varios idiomas. El producto será bueno, incluso conectará con nosotros, pero sabremos que detrás hay una Inteligencia Artificial (siempre que se nos informe de ello, claro está). Llegado ese punto, creo que valoraremos más los pódcast handmade, hechos por humanos. Paradójicamente, la IA podría llevarnos a apreciar de nuevo lo humano, lo imperfecto. Así que, vaso medio lleno.
¿Qué otras líneas relacionadas con el podcasting le interesan desde el punto de vista académico?
Además del interés por la Inteligencia Artificial Generativa de voz, mi principal línea de investigación es el estudio de la técnica publicitaria de branded content en el medio sonoro, que inicié con mi tesis doctoral. Desde entonces, he publicado varios artículos, entre los que destaca una propuesta de clasificación del branded podcast basada en la presencia de la marca en la narrativa. También he analizado cómo se integra la marca en los contenidos, comparado la implementación de la técnica en distintos formatos sonoros hablados, entre otros enfoques. En otoño de 2025 se publicará La despublicidad: el branded content en la radio y el podcasting, un libro divulgativo editado por Tirant lo Blanch, en el que explico las claves para producir un verdadero branded pódcast y no un pódcast con publicidad.
Usted imparte clases en la Universitat Internacional de Catalunya. ¿Están los futuros periodistas y comunicadores interesados en el mundo del podcast?
Les atrae mucho; sin embargo, no entienden el pódcast sin su extensión en vídeo. Es comprensible, porque la generación de estudiantes que ahora tenemos en las universidades es digital, visual y práctica. El videopódcast les permite contar con una imagen que facilita la promoción del contenido en redes sociales, y a los usuarios les da la posibilidad de consumir fragmentos visuales sin necesidad de acudir a la plataforma donde se aloja el pódcast ni escucharlo completo. Me preocupa que algunos podcasters estén más pendientes de las cámaras que de la narrativa sonora, y se refieren a la audiencia como espectadores, y no como oyentes. Y qué decir del atrezo, del escenario, de los micros de corbata o de la ausencia de auriculares. Que no se desdibuje la identidad inminentemente sonora del pódcast es una labor que nos corresponde asumir en las aulas con los futuros profesionales del podcasting.
Será la encargada de abrir la tercera edición de Prosodia. ¿Qué opina de este tipo de encuentros profesionales?
Para los académicos, los encuentros profesionales son una oportunidad única para tomar el pulso del campo en el que invertimos nuestra vida investigando. Tender puentes entre el ámbito profesional y el académico —y viceversa—, hablar entre nosotros para compartir experiencias, conocimiento y crear comunidad, es necesario y muy enriquecedor. En el caso de Prosodia, además, nos permite ‘romper la magia’ en el mejor sentido: poner rostro a muchas de las voces que escuchamos en las plataformas de podcasting.