🎧 L'Explorateur de podcasts ou la réinvention de la recherche audio

Pourquoi on vous en parle ? L’IA a pris de la place dans les expérimentations et projets de WeDoData depuis plus d’un an et logiquement, avec elles, d’infinis questionnements éthiques et écologiques. 🚨 Notre priorité : que l’usage de l’IA dans un projet provoque un effet levier fort en terme d’impact sociétal et/ou informationnel. Dans un paysage médiatique marqué par l’explosion du podcast, permettre aux utilisateur·rices de chercher des passages audio qui répondent exactement à leur demande constitue une avancée informationnelle forte.
Le challenge de départ. 200 épisodes de podcasts devenus impossibles à explorer car publiés sur des plateformes d’écoute aux moteurs de recherche défaillants, trop basiques ou inexistants. La recherche dans le titre et le résumé d’un épisode est trop sommaire au regard de la richesse d’un sonore d’une heure, voire plus. Or nous avons devant nous “Les enfants vont bien”, soit 200 témoignages uniques de familles 🏳️🌈 LGBTQIA+ qui racontent leurs parcours pour faire famille : un sujet très peu documenté en France.

Hacker le principe du moteur de recherche. Mobiliser de l’IA pour ce projet semblait opportun (transcription + embeddings). Pour proposer un saut qualitatif majeur, nous nous fixons deux ambitions fortes :
- Que l’internaute puisse poser sa question en langage naturel 💬 au lieu d’indiquer des mots-clés dans un champ de recherche
- Que l’internaute ne bénéficie pas “juste” de la remontée d’épisodes pertinents, mais celle des extraits 🔬 à l’intérieur des podcasts.

Les leçons d’une année de R&D sur le sujet.
❇️ Les IA ont un potentiel énorme en terme d’exploration fine des archives : c’est un domaine crucial pour les médias à l’heure des fake news et de la recherche d’informations vérifiées.
🚀
“L’Explorateur de podcasts” est désormais en ligne et accessible à tous·tes. Après avoir choisi un thème, posez directement votre question et vous verrez remonter 5 extraits d’épisodes. C’est une version beta qui n’attend que vos retours, n’hésitez pas !
POUR ALLER ENCORE PLUS LOIN
- Le Collectif Famille.s, association visant à connecter et visibiliser les familles LGBTQIA+, qui a encadré ce projet
- L’histoire de ce podcast racontée par sa créatrice Constance Démettre
- (Re)découvrez un projet nourri d’archives médias et d’IA : data.ina.fr mené à l’INA par WeDoData