Responsable : Jérôme FARINAS
Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.
Compétences
personnel de l’équipe
- Régine ANDRÉ-OBRECHTProfesseur Emérite (HDR) – UT
- Mathieu BALAGUERMaître de Conférences – UT
- Jérôme FARINASMaître de Conférences (HDR) – UT
- Isabelle FERRANÉMaître de Conférences – UT
- Philippe JOLYProfesseur – UT
- Julie MAUCLAIRMaître de Conférences (HDR) – UT
- Thomas PELLEGRINIMaître de Conférences – UT
- Julien PINQUIERProfesseur – UT
- Christine SENACMaître de Conférences – UT
- Philippe ALLETDoctorant – UT (co-encadrement APO)
- Lauriane BOMPAYDoctorant – Avignon Université
- Solène EVAINChercheur Contractuel – UT
- Alix FABRIOLDoctorant – UT
- Etienne LABBÉChercheur Contractuel – UT
- Adrien LAFOREDoctorant – UT (co-encadrement MELODI)
- Maxime LE COZChercheur Contractuel – EDINNOV
- Sandra PASQUALIStagiaire niveau M1 – UT
- Baptiste RAMONDADoctorant – UT
- Ghalia ROQAI CHAOUIStagiaire niveau M2 – Telecom Paris
- Flavie THIBAULTDoctorant – UT
- Ludovic TUNCAYDoctorant – UT
- Lionel FONTANChercheur Associé – Société Archean Technologies
- Lucile GELINChercheur Associé – Renaissance
- Nihel Loubna GHENNANIStagiaire doctoral – Université de Tlemcen
publications de l’équipe
Naoyuki Kamo, Naohiro Tawara, Atsushi Ando, Takatomo Kano, Hiroshi Sato, Rintaro Ikeshita, Takafumi Moriya, Shota Horiguchi, Kohei Matsuura, Atsunori Ogawa, Alexis Plaquet, Takanori Ashihara, Tsubasa Ochiai, Masato Mimura, Marc Delcroix, Tomohiro Nakatani, Taichi Asami, Shoko Araki
Microphone array geometry-independent multi-talker distant ASR: NTT system for DASR task of the CHiME-8 challenge
Computer Speech and Language, 2026, 95, pp.101820. ⟨10.1016/j.csl.2025.101820⟩
Accès: https://hal.science/hal-05265153v1
Yohan Gallois, Jeanne Souche, Yann Lemaire, Lila Gravellier, Pascal Barone, Linda Nicolini, Jérome Farinas, Pascal Gaillard, Virginie Woisard
Studying the neural correlates of upper aerodigestive tract functions under natural conditions: A protocol using functional near-infrared spectroscopy, cervical acoustics, and accelerometry
Brain Organoid and Systems Neuroscience Journal, 2025, 3, pp.56-68. ⟨10.1016/j.bosn.2025.04.002⟩
Accès: https://hal.science/hal-05368388v1
Romain Carin, Corentin Faucher, Philippe Connes, Violette Viard, Marie Martin, Marie Ducray, Robin Pla, Magali Merino, Anne-Fleur Gaston, Jerome Lacroix, Gregory Doucende, Philippe Joly, Emeric Stauffer, Julien Brugniaux, Samuel Verges, Franck Brocherie, Aurélien Pichon, Paul Robach, Elie Nader
Persisting elevation of total hemoglobin mass after altitude training in elite swimmers: a potential role of prolonged erythrocyte survival
AJP – Heart and Circulatory Physiology, 2025, 329 (4), pp.H789-H800. ⟨10.1152/ajpheart.00334.2025⟩
Accès: https://hal.science/hal-05471194v1
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Prediction of Speech Impairment in Patients Treated for Oral or Oropharyngeal Cancer Using Automatic Speech Analysis
International Journal of Language and Communication Disorders, 2025, 60 (5), pp.e70103. ⟨10.1111/1460-6984.70103⟩
Accès: https://ut3-toulouseinp.hal.science/hal-05251621v1
Yohan Gallois, Jeanne Souche, Yann Lemaire, Lila Gravellier, Pascal Barone, Linda Nicolini, Jérôme Farinas, Pascal Gaillard, Virginie Woisard
Studying the neural correlates of upper aerodigestive tract functions under natural conditions: A protocol using functional near-infrared spectroscopy, cervical acoustics, and accelerometry
Brain Organoid and Systems Neuroscience Journal, 2025, 3, pp.56-68. ⟨10.1016/j.bosn.2025.04.002⟩
Accès: https://hal.science/hal-05032902v1
Marvin Lavechin, Maureen de Seyssel, Hadrien Titeux, Guillaume Wisniewski, Hervé Bredin, Alejandrina Cristia, Emmanuel Dupoux
Simulating Early Phonetic and Word Learning Without Linguistic Categories
Developmental Science, 2025, 28 (2), pp.e13606. ⟨10.1111/desc.13606⟩
Accès: https://hal.science/hal-04869271v1
Étienne Labbé, Thomas Pellegrini, Julien Pinquier
CoNeTTE: An Efficient Audio Captioning System Leveraging Multiple Datasets With Task Embedding
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2024, 32, pp.3785-3794. ⟨10.1109/TASLP.2024.3430813⟩
Accès: https://hal.science/hal-04956595v1
Sebastião Quintas, Robin Vaysse, Mathieu Balaguer, Vincent Roger, Julie Mauclair, Jérôme Farinas, Virginie Woisard, Julien Pinquier, Julien Pinquier
SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers
Frontiers in Artificial Intelligence, 2024, 7, ⟨10.3389/frai.2024.1359094⟩
Accès: https://hal.science/hal-04595273v1
Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier
Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility
International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩
Accès: https://hal.science/hal-04405083v1
Marvin Lavechin, Maureen de Seyssel, Marianne Métais, Florian Metze, Abdelrahman Mohamed, Hervé Bredin, Emmanuel Dupoux, Alejandrina Cristia
Modeling early phonetic acquisition from child-centered audio data
Cognition, 2024, 245, 245, pp.21. ⟨10.1016/j.cognition.2024.105734⟩
Accès: https://hal.science/hal-04876433v1
La modélisation automatique de l’intelligibilité pour améliorer la qualité de vie des patients atteints de troubles de la parole : un exemple d’IA dans le domaine médical
A.N.A.E. Approche neuropsychologique des apprentissages chez l’enfant, 2024, 36 (189), pp.137-141
Accès: https://hal.science/hal-04602548v2
Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard
Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL
Rééducation orthophonique, 2021, Chapitre : « De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix », 286, pp.1-13
Accès: https://ut3-toulouseinp.hal.science/hal-03277422v1
Mathieu Balaguer, Josiane Percodani, Virginie Woisard
Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS
Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩
Accès: https://hal.science/hal-02553232v1
Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (en ligne), 2016.
Accès : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeXLionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, p. 151-174, mars 2015.
Résumé Accès : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeXBlandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
Dans : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, p. 38-42, 2014.
Accès : https://oatao.univ-toulouse.fr/13000/
BibTeXDavid Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
Dans : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (en ligne), 2011.
Accès : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeXJérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
Dans : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, p. 81-97, 2005.
Accès : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeXJulien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
Dans : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, p. 831-852, 2003.
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
Dans : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, p. 379-382, 1999.
Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
Accès : http://www.irit.fr/publis/SAMOVA/
BibTeXEbroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
Mathieu Balaguer, Clémence Devoucoux, Virginie Woisard, Jérôme Farinas, Julien Pinquier
Analysis of acoustic-motor relationship after oral or oropharyngeal cancer using an automatic phonemic inventory
IALP 2025 33rd World Congress, International Association of Communication Sciences and Disorders, Aug 2025, San Giljan, Malta. ⟨10.2310/7070.2008.1001⟩
Accès: https://hal.science/hal-05413208v1
Lucile Gelin, Lucas Block Medin, Alexandre Cruel, Alice Liu
Combining word and phoneme speech recognition for fluency assessment of young children’s oral reading
10th Workshop on Speech and Language Technology in Education (SLaTE), Aug 2025, Nijmegen, Netherlands. pp.16-20, ⟨10.21437/SLaTE.2025-4⟩
Accès: https://hal.science/hal-05306212v1
Joonas Kalda, Clément Pagés, Tanel Alumäe, Hervé Bredin
Diarization-Guided Multi-Speaker Embeddings
Interspeech 2025, Aug 2025, Rotterdam (NL), Netherlands. pp.5233-5237, ⟨10.21437/Interspeech.2025-1807⟩
Accès: https://hal.science/hal-05415778v1
Ludovic Tuncay, Etienne Labbé, Emmanouil Benetos, Thomas Pellegrini
Audio-JEPA: Joint-Embedding Predictive Architecture for Audio Representation Learning
ICME 2025, Jun 2025, Nantes, France
Accès: https://hal.science/hal-05128180v1
Baptiste Ramonda, Isabelle Ferrané, Julien Pinquier
Amélioration de la lisibilité de textes via l’utilisation de LLM
CORIA-TALN, Jun 2025, Marseille, France
Accès: https://hal.science/hal-05232434v1
Etienne Labbé, Brice Brossette, Nathalie Camelin, Tiphaine Caudrelier, Eddy Cavalli, Isabelle Ferrané, Barbara Lutz, Véronique Moriceau, Thomas Pellegrini, Julien Pinquier, Cantin Prat, Lucile Gelin
Annotation de résumés oraux d’élèves de primaire pour l’analyse automatique des capacités de compréhension de la lecture
Atelier IA-EDU @ CORIA-TALN 2025, Ismail BADACHE, Jun 2025, Marseille, France
Accès: https://hal.science/hal-05125805v1
Philippe Allet, Jérôme Farinas, Sandrine Mouysset
Etude de l’efficacité des réflexes de défenses des voies aériennes chez les sujets présentant des symptômes dysphagiques par l’Auscultation Cervicale à Haute Résolution
Journées Phonétique Clinique 2025, Jun 2025, Sète (34200), France
Accès: https://ut3-toulouseinp.hal.science/hal-05207568v1
Mathieu Balaguer, Clémence Devoucoux, Virginie Woisard, Jérôme Farinas, Julien Pinquier
Étude des liens acoustico-moteurs après cancer oral ou oropharyngé par réalisation d’un inventaire phonémique automatique
10èmes Journées de Phonétique Clinique, Jun 2025, Sète, France
Accès: https://hal.science/hal-05142322v1
Tuan Nguyen, Corinne Fredouille, Alain Ghio, Mathieu Balaguer, Virginie Woisard
Impact des sources de parole sur la prise de décision des modèles pour l’évaluation des troubles de la parole
10èmes Journées de Phonétique Clinique, Jun 2025, Sète, France
Accès: https://hal.science/hal-05189209v1
Alexis Plaquet, Naohiro Tawara, Marc Delcroix, Shota Horiguchi, Atsushi Ando, Shoko Araki
Mamba-based Segmentation Model for Speaker Diarization
2025 IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2025, Hyderabab, India. pp.1-5, ⟨10.1109/ICASSP49660.2025.10889446⟩
Accès: https://hal.science/hal-05006565v1
Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier
Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales
31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.102-111
Accès: https://inria.hal.science/hal-04623063v1
Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané
Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique
31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.361-370
Accès: https://inria.hal.science/hal-04623087v1
Lucas Block Medin, Lucile Gelin, Thomas Pellegrini
Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d’enfant
31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.231-241
Accès: https://inria.hal.science/hal-04623075v1
Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier, Virginie Woisard
Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes
31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.61-70
Accès: https://inria.hal.science/hal-04623060v1
Verdiana De Fino, Isabelle Ferrané, Julien Pinquier, Lionel Fontan
Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE
31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.492-501
Accès: https://inria.hal.science/hal-04623099v1
Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané
Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques
Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France
Accès: https://hal.science/hal-04331354v1
Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier
Prédiction de la compréhensibilité de la parole d’apprenants de français
Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France
Accès: https://hal.science/hal-04329163v1
Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier
Evaluation de la détection automatique des activités pharyngolaryngées dans les signaux d’auscultation cervicale à haute résolution chez les personnes âgées
3ème journée de la Société Française de Déglutition et de Dysphagie (SF2D 2023), Société Française de Déglutition et de Dysphagie, Nov 2023, Toulouse, France
Accès: https://hal.science/hal-04560917v1
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole
55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France
Accès: https://hal.science/hal-04297963v1
Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient
58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France
Accès: https://hal.science/hal-04230870v1
Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera
Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées
Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6
Accès: https://hal.science/hal-02424850v1
Alexandre Boyer, Etienne Sicard
Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC
Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1
Accès: https://hal.science/hal-01951651v1
Automatic correction of adverb placement errors for CALL
Dans : Eurocall12. G Lund (Eds.) , EUROCALL Association, (support électronique), juillet 2012.
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
Dans : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, p. 297-326, 2009.
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
Dans : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (en ligne), août 2009.
Accès : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeXIterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
Dans : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, p. 301-332, janvier 2009.
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
Dans : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, p. 28-56, Vol. 4885/2007, LNCS, 2007.
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
Dans : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, p. 118-134, Vol. 4391/2007, LNCS, 2007.
Descriptions des séquences d’images
Dans : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, p. 119-136, Traité IC2, série Traitement du signal et de l’image, mai 2007.
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
Dans : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, p. 255-268, 2006.
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
Dans : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, p. 307-330, Vol. 29, Text, Speech and Language Technology, novembre 2006.
Accès : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeXEnjeux d’une normalisation pour l’indexation des contenus multimédia
Dans : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, p. 157-169, Informatique et Systèmes d’Information, février 2005.
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier
Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, pp.1–740, 2024, 978-2-917490-37-2
Accès: https://inria.hal.science/hal-04623005v1
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier
Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d’articles publiés
35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, pp.1–22, 2024, 978-2- 917490-39-6
Accès: https://inria.hal.science/hal-04622991v1
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier
Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole
35èmes Journées d’Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), ATALA & AFPC, 2024
Accès: https://inria.hal.science/hal-04623053v1
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier
Actes de JEP-TALN-RECITAL 2024. Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues
35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024
Accès: https://inria.hal.science/hal-04622982v1
Mathieu Balaguer, Lila Gravellier, Julien Pinquier
Actes des 9èmes Journées de Phonétique Clinique
Institut de Recherche en Informatique de Toulouse, 2023, 978-2-917490-35-8
Accès: https://hal.science/hal-04126591v2
Mathieu Lagrange, Annamaria Mesaros, Thomas Pellegrini, Gael Richard, Romain Serizel, Dan Stowell
Proceedings of the 7th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022)
Tampere University, pp.1-225, 2022, 978-952-03-2677-7
Accès: https://inria.hal.science/hal-03850901v1
Philippe Aigrain, Philippe Joly, Véronique Longueville
Medium Knowledge-Based Macrosegmentation of Video into Sequences in Proc. of IJCAI’95: Workshop on Intelligent Multimedia Information Retrieval, –, Mark Maybury, Montréal, août 1995.
Diagnostiquer la parole : caractérisation et modélisation automatique
Informatique [cs]. Université toulouse 3 Paul Sabatier, 2024
Accès: https://hal.science/tel-04906651v1
Analyse automatique de signaux d’auscultation cervicale à haute résolution : Détection et caractérisation des déglutitions
Traitement du signal et de l’image [eess.SP]. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES145⟩
Accès: https://theses.hal.science/tel-04975236v1
Description automatique des événements sonores par des méthodes d’apprentissage profond
Apprentissage [cs.LG]. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES054⟩
Accès: https://theses.hal.science/tel-04642941v1
Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues
Sciences de l’information et de la communication. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES034⟩
Accès: https://hal.science/tel-04582745v2
La parole : du traitement automatique à la mesure de l’intelligibilité
Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023
Accès: https://hal.science/tel-04381096v1
Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩
Accès: https://theses.hal.science/tel-04229622v1
Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩
Accès: https://theses.hal.science/tel-04198849v1
Deep learning approaches to assess speech intelligibility of head and neck cancer
Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩
Accès: https://theses.hal.science/tel-04094765v1
Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?
Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩
Accès: https://theses.hal.science/tel-04064038v1
Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique
Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩
Accès: https://theses.hal.science/tel-03935738v1
Ryan Niel Tayou Mbede, Julien Pinquier
ÉTUDE DE LA MESURE D’INTELLIGIBILITÉ DE SIGNAUX AUDIO PAR DES MÉTHODES D’INTELLIGENCE ARTIFICIELLE
IRIT. 2025
Accès: https://hal.science/hal-05228455v1
Fabrice Neveu, Jean Baqué, Alain Ghio, Jérôme Farinas, Eric Vérin, Emmanuelle Cugy, Sylvain Moriniere, Virginie Woisard
Non-Invasive Exploration of Pharyngo-Laryngeal Functions for a Comprehensive Assessment of Swallowing: A Sensor Selection Procedure from scoping review
Agence National de la Recherche (ANR). 2024
Accès: https://hal.science/hal-05103044v1
Séverin Baroudi, Hervé Bredin, Alexis Plaquet, Thomas Pellegrini
pyannote.audio speaker diarization pipeline at VoxSRC 2023
IRIT – Institut de Recherche en Informatique de Toulouse. 2023
Accès: https://hal.science/hal-04969548v1
Etienne Sicard, Anne Menin-Sicard
La diadococinésie et son application en orthophonique clinique
[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020
Accès: https://hal.science/hal-02512856v1
Etienne Sicard, Anne Menin-Sicard
Analyse de la qualité des phrases pour un bilan objectif de la parole
[Rapport de recherche] INSA Toulouse. 2019
Accès: https://hal.science/hal-02389764v2
Thomas Pellegrini, Céline Manenti, Julien Pinquier
The IRIT-UPS system @ ZeroSpeech 2017
[Research Report] IRIT. 2017
Accès: https://hal.science/hal-03131886v1
Maëlys Salingre, Jérôme Farinas, Stéphane Rabant
Automatic identification of French regional accent
[Rapport de recherche] IRIT. 2017
Accès: https://hal.science/hal-03120304v1
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Rapport de Master, Université Paul Sabatier, juin 2011.
Résumé Accès : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeXIndexation en intervenant d’un document vidéo par identification du visage
Rapport de Master, Université Paul Sabatier, juin 2007.
Accès : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeXDescription de comportements humains et interrogation.
Rapport de Master, Université de Toulouse, juin 2006.
Accès : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeXCaractérisation de la voix chantée
Rapport de Master, Institut National Polytechnique de Toulouse, juin 2006.
Application des matrices de similarité à la comparaison de contenus sonores
Rapport de Master, Université Paul Sabatier, juin 2006.
Segmentation et regroupement en locuteurs d’un document sonore
Rapport de Master, Université Paul Sabatier, juin 2006.
Caractérisation d’un intervenant dans un document audiovisuel
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Etude constractive de décodeurs acoustico-phonétique
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Contribution à l’indexation multimedia
Rapport de recherche, IRIT/2005-8-R, IRIT, mars 2005.
Méthodes à vecteurs de support et indexation sonore
Rapport de stage, DEA IIL, Université Paul Sabatier, 2004.
contrats de l’équipe
| Acronyme | Titre | Cadre Financement | Resp. sc | Début |
|---|---|---|---|---|
| pyannote.mobile [Contrat terminé] | On-device streaming speaker diarization | Programmes européens (hors ERC et fonds structurels) | | 2024 |
| TAPAS [Contrat terminé] | Training Network on Automatic Processing of PAthological Speech | Programmes européens (hors ERC et fonds structurels) | Julie MAUCLAIR | 2017 |
| VICTORIA [Contrat terminé] | Video analysis for Investigation of Criminal and TerrORIst Activities | Programmes européens (hors ERC et fonds structurels) | Philippe JOLY | 2017 |

| Acronyme | Titre | Cadre Financement | Resp. sc | Début |
|---|---|---|---|---|
| PhLEs-NID | Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée | Appels à projets ANR (hors PIA) | Jérôme FARINAS | 2022 |
| SeRiouSLy | Segmentation, Regroupement, et Séparation des Locuteurs | Autres financements publics sur appel à projets | | 2022 |
| CHICA-AI | Entraîner les compétences de compréhension en lecture des enfants avec une intelligence artificielle adaptée | Appels à projets ANR (hors PIA) | Thomas PELLEGRINI | 2023 |
| AMELIORE | Étude des mécanismes d’adaptation suite à l’amputation totale et partielle de la langue : description et modélisation des processus mis en place au niveau physiologique, linguistique et comportemental | Autres financements publics sur appel à projets | Jérôme FARINAS | 2024 |
| BLeRIOT | Investigation du Bea, du Lisic, de Reseda et de lIrit sur la transcription de parole aéronautique | Appels à projets ANR (hors PIA) | Julien PINQUIER | 2024 |
| Le Petit Camion | Limiter loccurrence de biais attentionnels dans les Centres de Traitement de lAlerte | Appels à projets ANR (hors PIA) | Julien PINQUIER | 2025 |
| OLINPIC | Restaurer la parole perturbée pour améliorer intelligibilité, la compréhensibilité et la communication | Appels à projets ANR (hors PIA) | Jérôme FARINAS | 2025 |
| TAPASCCO | Adaptation et amélioration de la reconnaissance automatique de la parole spontanée après cancer oral ou oropharyngé dans la réhabilitation et lévaluation de la communication | Fondations, associations, mécénats | Julien PINQUIER | 2025 |
| CONNECTS – RUGBI [Contrat terminé] | aCtiONs eN faveur du dialogue entre rEcherChe eT Société : Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique | Appels à projets ANR (hors PIA) | Jérôme FARINAS | 2024 |
| ADAPT [Contrat terminé] | Aide à l’Analyse et au Diagnostic de la Parole pathologique pour les Thérapeutes | Institut Carnot | Julien PINQUIER | 2023 |
| PATY [Contrat terminé] | Plateforme de traitement de parole atypique | Institut Carnot | Jérôme FARINAS | 2021 |
| OSIRIM [Contrat terminé] | Observatoire des Systèmes d’Indexation et de Recherche d’Informations | Appels à projets internes à une tutelle | Philippe JOLY | 2020 |
| Park-MSA [Contrat terminé] | Park-MSA | Institut Carnot | Julie MAUCLAIR | 2020 |
| [Contrat terminé] | Low-latency online speakerdiarization | Fondations, associations, mécénats | | 2020 |
| LabCom : ALAIA [Contrat terminé] | Laboratoire Commun : Apprentissage des Langues Assisté par Intelligence Artificielle | Appels à projets ANR (hors PIA) | Isabelle FERRANÉ | 2019 |
| LinTo [Contrat terminé] | Assistant vocal open-source respectueux des données personnelles pour lentreprise | Programme d’Investissements d’Avenir (PIA) | Isabelle FERRANÉ | 2018 |
| LUDAU [Contrat terminé] | Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond | Appels à projets ANR (hors PIA) | Thomas PELLEGRINI | 2018 |
| RUGBI [Contrat terminé] | Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique | Appels à projets ANR (hors PIA) | Jérôme FARINAS | 2018 |
| Toulouse mind & brain institut – Bourse de stage [Contrat terminé] | AAP Toulouse mind & brain institut – TMBI : Réalisation d’une plateforme logicielle pour l’analyse et la mesure de la dysfluence prosodique en parole pathologique | Autres financements publics sur appel à projets | Jérôme FARINAS | 2018 |
| Toulouse mind & brain institut – TMBI – Bourse de stage [Contrat terminé] | AAP Toulouse mind & brain institut – TMBI : Spiking neural networks for bird song detection | Autres financements publics sur appel à projets | Thomas PELLEGRINI | 2018 |
| ECREME (complément de financement) [Contrat terminé] | Complément de financement Allocation Doctorale UFT : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE | Autres financements publics sur appel à projets | Julien PINQUIER | 2017 |
| VOICE4PD – MSA [Contrat terminé] | Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole | Appels à projets ANR (hors PIA) | Julie MAUCLAIR | 2016 |
| C2SI [Contrat terminé] | Carcinologic Speech Severity Index Mesure , de l’impact des traitements des cancers de la cavité buccale et du pharynx sur la production de la parole par l’indice de sévérité des troubles de la production de la parole | Autres financements publics sur appel à projets | Jérôme FARINAS | 2015 |
| CIESS [Contrat terminé] | Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement | Appels à projets ANR (hors PIA) | Régine ANDRÉ-OBRECHT | 2013 |
| DIADEMS [Contrat terminé] | Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores | Appels à projets ANR (hors PIA) | Régine ANDRÉ-OBRECHT | 2013 |

| Acronyme | Titre | Cadre Financement | Resp. sc | Début |
|---|---|---|---|---|
| AUDIOCAP [Contrat terminé] | Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole | Fonds structurels européens | Julien PINQUIER | 2019 |
| EVOLEX2 [Contrat terminé] | Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers | Fonds structurels européens | Julien PINQUIER | 2019 |
| INGPRO [Contrat terminé] | Incidence des gestes sur la prononciation | Collectivités territoriales | Isabelle FERRANÉ | 2019 |
| SAMI [Contrat terminé] | Allocation Doctorale : Système automatisé de mesure de lintelligibilité | Collectivités territoriales | Julien PINQUIER | 2018 |
| ECREME [Contrat terminé] | Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE | Collectivités territoriales | Julien PINQUIER | 2017 |
| PHONICS [Contrat terminé] | CLE : Intelligent Electronic Device for Measuring Speech Comprehension | Collectivités territoriales | Jérôme FARINAS | 2014 |

