Équipe SAMOVA

Responsable : Jérôme FARINAS


 

Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.

Compétences

Traitement automatique de la parole (acoustique, prosodique), déglutition, musique et sons environnementaux
Segmentation, analyse et modélisation audio et vidéo
Mesures automatiques d'intelligibilité et de compréhensibilité
Interaction conversationnelle multimodale
Pathologies de la parole : production et perception

personnel de l’équipe

Membres permanents
Membres non – permanents
Membres extérieur

publications de l’équipe

Articles dans des revues internationales
  • Naoyuki Kamo, Naohiro Tawara, Atsushi Ando, Takatomo Kano, Hiroshi Sato, Rintaro Ikeshita, Takafumi Moriya, Shota Horiguchi, Kohei Matsuura, Atsunori Ogawa, Alexis Plaquet, Takanori Ashihara, Tsubasa Ochiai, Masato Mimura, Marc Delcroix, Tomohiro Nakatani, Taichi Asami, Shoko Araki

    Microphone array geometry-independent multi-talker distant ASR: NTT system for DASR task of the CHiME-8 challenge

    Computer Speech and Language, 2026, 95, pp.101820. ⟨10.1016/j.csl.2025.101820⟩

    Accès: https://hal.science/hal-05265153v1

  • Yohan Gallois, Jeanne Souche, Yann Lemaire, Lila Gravellier, Pascal Barone, Linda Nicolini, Jérome Farinas, Pascal Gaillard, Virginie Woisard

    Studying the neural correlates of upper aerodigestive tract functions under natural conditions: A protocol using functional near-infrared spectroscopy, cervical acoustics, and accelerometry

    Brain Organoid and Systems Neuroscience Journal, 2025, 3, pp.56-68. ⟨10.1016/j.bosn.2025.04.002⟩

    Accès: https://hal.science/hal-05368388v1

  • Romain Carin, Corentin Faucher, Philippe Connes, Violette Viard, Marie Martin, Marie Ducray, Robin Pla, Magali Merino, Anne-Fleur Gaston, Jerome Lacroix, Gregory Doucende, Philippe Joly, Emeric Stauffer, Julien Brugniaux, Samuel Verges, Franck Brocherie, Aurélien Pichon, Paul Robach, Elie Nader

    Persisting elevation of total hemoglobin mass after altitude training in elite swimmers: a potential role of prolonged erythrocyte survival

    AJP – Heart and Circulatory Physiology, 2025, 329 (4), pp.H789-H800. ⟨10.1152/ajpheart.00334.2025⟩

    Accès: https://hal.science/hal-05471194v1

  • Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

    Prediction of Speech Impairment in Patients Treated for Oral or Oropharyngeal Cancer Using Automatic Speech Analysis

    International Journal of Language and Communication Disorders, 2025, 60 (5), pp.e70103. ⟨10.1111/1460-6984.70103⟩

    Accès: https://ut3-toulouseinp.hal.science/hal-05251621v1

  • Yohan Gallois, Jeanne Souche, Yann Lemaire, Lila Gravellier, Pascal Barone, Linda Nicolini, Jérôme Farinas, Pascal Gaillard, Virginie Woisard

    Studying the neural correlates of upper aerodigestive tract functions under natural conditions: A protocol using functional near-infrared spectroscopy, cervical acoustics, and accelerometry

    Brain Organoid and Systems Neuroscience Journal, 2025, 3, pp.56-68. ⟨10.1016/j.bosn.2025.04.002⟩

    Accès: https://hal.science/hal-05032902v1

  • Marvin Lavechin, Maureen de Seyssel, Hadrien Titeux, Guillaume Wisniewski, Hervé Bredin, Alejandrina Cristia, Emmanuel Dupoux

    Simulating Early Phonetic and Word Learning Without Linguistic Categories

    Developmental Science, 2025, 28 (2), pp.e13606. ⟨10.1111/desc.13606⟩

    Accès: https://hal.science/hal-04869271v1

  • Étienne Labbé, Thomas Pellegrini, Julien Pinquier

    CoNeTTE: An Efficient Audio Captioning System Leveraging Multiple Datasets With Task Embedding

    IEEE/ACM Transactions on Audio, Speech and Language Processing, 2024, 32, pp.3785-3794. ⟨10.1109/TASLP.2024.3430813⟩

    Accès: https://hal.science/hal-04956595v1

  • Sebastião Quintas, Robin Vaysse, Mathieu Balaguer, Vincent Roger, Julie Mauclair, Jérôme Farinas, Virginie Woisard, Julien Pinquier, Julien Pinquier

    SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers

    Frontiers in Artificial Intelligence, 2024, 7, ⟨10.3389/frai.2024.1359094⟩

    Accès: https://hal.science/hal-04595273v1

  • Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

    Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

    International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

    Accès: https://hal.science/hal-04405083v1

  • Marvin Lavechin, Maureen de Seyssel, Marianne Métais, Florian Metze, Abdelrahman Mohamed, Hervé Bredin, Emmanuel Dupoux, Alejandrina Cristia

    Modeling early phonetic acquisition from child-centered audio data

    Cognition, 2024, 245, 245, pp.21. ⟨10.1016/j.cognition.2024.105734⟩

    Accès: https://hal.science/hal-04876433v1

  • Articles dans des revues nationales
  • Jérôme Farinas

    La modélisation automatique de l’intelligibilité pour améliorer la qualité de vie des patients atteints de troubles de la parole : un exemple d’IA dans le domaine médical

    A.N.A.E. Approche neuropsychologique des apprentissages chez l’enfant, 2024, 36 (189), pp.137-141

    Accès: https://hal.science/hal-04602548v2

  • Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

    Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

    Rééducation orthophonique, 2021, Chapitre : « De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix », 286, pp.1-13

    Accès: https://ut3-toulouseinp.hal.science/hal-03277422v1

  • Mathieu Balaguer, Josiane Percodani, Virginie Woisard

    Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

    Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

    Accès: https://hal.science/hal-02553232v1

  • Articles dans des revues nationales
    Rédaction de numéros spéciaux de revues
    Conférences et workshops internationaux avec actes édités et comité de lecture
  • Mathieu Balaguer, Clémence Devoucoux, Virginie Woisard, Jérôme Farinas, Julien Pinquier

    Analysis of acoustic-motor relationship after oral or oropharyngeal cancer using an automatic phonemic inventory

    IALP 2025 33rd World Congress, International Association of Communication Sciences and Disorders, Aug 2025, San Giljan, Malta. ⟨10.2310/7070.2008.1001⟩

    Accès: https://hal.science/hal-05413208v1

  • Lucile Gelin, Lucas Block Medin, Alexandre Cruel, Alice Liu

    Combining word and phoneme speech recognition for fluency assessment of young children’s oral reading

    10th Workshop on Speech and Language Technology in Education (SLaTE), Aug 2025, Nijmegen, Netherlands. pp.16-20, ⟨10.21437/SLaTE.2025-4⟩

    Accès: https://hal.science/hal-05306212v1

  • Joonas Kalda, Clément Pagés, Tanel Alumäe, Hervé Bredin

    Diarization-Guided Multi-Speaker Embeddings

    Interspeech 2025, Aug 2025, Rotterdam (NL), Netherlands. pp.5233-5237, ⟨10.21437/Interspeech.2025-1807⟩

    Accès: https://hal.science/hal-05415778v1

  • Ludovic Tuncay, Etienne Labbé, Emmanouil Benetos, Thomas Pellegrini

    Audio-JEPA: Joint-Embedding Predictive Architecture for Audio Representation Learning

    ICME 2025, Jun 2025, Nantes, France

    Accès: https://hal.science/hal-05128180v1

  • Baptiste Ramonda, Isabelle Ferrané, Julien Pinquier

    Amélioration de la lisibilité de textes via l’utilisation de LLM

    CORIA-TALN, Jun 2025, Marseille, France

    Accès: https://hal.science/hal-05232434v1

  • Etienne Labbé, Brice Brossette, Nathalie Camelin, Tiphaine Caudrelier, Eddy Cavalli, Isabelle Ferrané, Barbara Lutz, Véronique Moriceau, Thomas Pellegrini, Julien Pinquier, Cantin Prat, Lucile Gelin

    Annotation de résumés oraux d’élèves de primaire pour l’analyse automatique des capacités de compréhension de la lecture

    Atelier IA-EDU @ CORIA-TALN 2025, Ismail BADACHE, Jun 2025, Marseille, France

    Accès: https://hal.science/hal-05125805v1

  • Philippe Allet, Jérôme Farinas, Sandrine Mouysset

    Etude de l’efficacité des réflexes de défenses des voies aériennes chez les sujets présentant des symptômes dysphagiques par l’Auscultation Cervicale à Haute Résolution

    Journées Phonétique Clinique 2025, Jun 2025, Sète (34200), France

    Accès: https://ut3-toulouseinp.hal.science/hal-05207568v1

  • Mathieu Balaguer, Clémence Devoucoux, Virginie Woisard, Jérôme Farinas, Julien Pinquier

    Étude des liens acoustico-moteurs après cancer oral ou oropharyngé par réalisation d’un inventaire phonémique automatique

    10èmes Journées de Phonétique Clinique, Jun 2025, Sète, France

    Accès: https://hal.science/hal-05142322v1

  • Tuan Nguyen, Corinne Fredouille, Alain Ghio, Mathieu Balaguer, Virginie Woisard

    Impact des sources de parole sur la prise de décision des modèles pour l’évaluation des troubles de la parole

    10èmes Journées de Phonétique Clinique, Jun 2025, Sète, France

    Accès: https://hal.science/hal-05189209v1

  • Alexis Plaquet, Naohiro Tawara, Marc Delcroix, Shota Horiguchi, Atsushi Ando, Shoko Araki

    Mamba-based Segmentation Model for Speaker Diarization

    2025 IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2025, Hyderabab, India. pp.1-5, ⟨10.1109/ICASSP49660.2025.10889446⟩

    Accès: https://hal.science/hal-05006565v1

  • Conférences et workshops nationaux avec actes édités et comité de lecture
  • Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

    Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales

    31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.102-111

    Accès: https://inria.hal.science/hal-04623063v1

  • Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

    Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique

    31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.361-370

    Accès: https://inria.hal.science/hal-04623087v1

  • Lucas Block Medin, Lucile Gelin, Thomas Pellegrini

    Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d’enfant

    31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.231-241

    Accès: https://inria.hal.science/hal-04623075v1

  • Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier, Virginie Woisard

    Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes

    31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.61-70

    Accès: https://inria.hal.science/hal-04623060v1

  • Verdiana De Fino, Isabelle Ferrané, Julien Pinquier, Lionel Fontan

    Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE

    31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.492-501

    Accès: https://inria.hal.science/hal-04623099v1

  • Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

    Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

    Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

    Accès: https://hal.science/hal-04331354v1

  • Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

    Prédiction de la compréhensibilité de la parole d’apprenants de français

    Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

    Accès: https://hal.science/hal-04329163v1

  • Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

    Evaluation de la détection automatique des activités pharyngolaryngées dans les signaux d’auscultation cervicale à haute résolution chez les personnes âgées

    3ème journée de la Société Française de Déglutition et de Dysphagie (SF2D 2023), Société Française de Déglutition et de Dysphagie, Nov 2023, Toulouse, France

    Accès: https://hal.science/hal-04560917v1

  • Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

    Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

    55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

    Accès: https://hal.science/hal-04297963v1

  • Mathieu Balaguer

    Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

    58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

    Accès: https://hal.science/hal-04230870v1

  • Livres (monographies)
  • Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

    Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

    Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

    Accès: https://hal.science/hal-02424850v1

  • Alexandre Boyer, Etienne Sicard

    Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

    Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

    Accès: https://hal.science/hal-01951651v1

  • Contributions à des ouvrages de synthèse
    Recueils des communications
  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, pp.1–740, 2024, 978-2-917490-37-2

    Accès: https://inria.hal.science/hal-04623005v1

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d’articles publiés

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, pp.1–22, 2024, 978-2- 917490-39-6

    Accès: https://inria.hal.science/hal-04622991v1

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole

    35èmes Journées d’Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04623053v1

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04622982v1

  • Mathieu Balaguer, Lila Gravellier, Julien Pinquier

    Actes des 9èmes Journées de Phonétique Clinique

    Institut de Recherche en Informatique de Toulouse, 2023, 978-2-917490-35-8

    Accès: https://hal.science/hal-04126591v2

  • Mathieu Lagrange, Annamaria Mesaros, Thomas Pellegrini, Gael Richard, Romain Serizel, Dan Stowell

    Proceedings of the 7th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022)

    Tampere University, pp.1-225, 2022, 978-952-03-2677-7

    Accès: https://inria.hal.science/hal-03850901v1

  • Rédaction d'actes de conférences et de workshops
    Thèses et habilitations
  • Julie Mauclair

    Diagnostiquer la parole : caractérisation et modélisation automatique

    Informatique [cs]. Université toulouse 3 Paul Sabatier, 2024

    Accès: https://hal.science/tel-04906651v1

  • Lila Gravellier

    Analyse automatique de signaux d’auscultation cervicale à haute résolution : Détection et caractérisation des déglutitions

    Traitement du signal et de l’image [eess.SP]. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES145⟩

    Accès: https://theses.hal.science/tel-04975236v1

  • Etienne Labbé

    Description automatique des événements sonores par des méthodes d’apprentissage profond

    Apprentissage [cs.LG]. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES054⟩

    Accès: https://theses.hal.science/tel-04642941v1

  • Verdiana De Fino

    Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

    Sciences de l’information et de la communication. Université de Toulouse, 2024. Français. ⟨NNT : 2024TLSES034⟩

    Accès: https://hal.science/tel-04582745v2

  • Jérôme Farinas

    La parole : du traitement automatique à la mesure de l’intelligibilité

    Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

    Accès: https://hal.science/tel-04381096v1

  • Benjamin Chamand

    Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

    Accès: https://theses.hal.science/tel-04229622v1

  • Robin Vaysse

    Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

    Accès: https://theses.hal.science/tel-04198849v1

  • Sebastião Quintas

    Deep learning approaches to assess speech intelligibility of head and neck cancer

    Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

    Accès: https://theses.hal.science/tel-04094765v1

  • Estelle Randria

    Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

    Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

    Accès: https://theses.hal.science/tel-04064038v1

  • Vincent Roger

    Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

    Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

    Accès: https://theses.hal.science/tel-03935738v1

  • Rapports
  • Ryan Niel Tayou Mbede, Julien Pinquier

    ÉTUDE DE LA MESURE D’INTELLIGIBILITÉ DE SIGNAUX AUDIO PAR DES MÉTHODES D’INTELLIGENCE ARTIFICIELLE

    IRIT. 2025

    Accès: https://hal.science/hal-05228455v1

  • Fabrice Neveu, Jean Baqué, Alain Ghio, Jérôme Farinas, Eric Vérin, Emmanuelle Cugy, Sylvain Moriniere, Virginie Woisard

    Non-Invasive Exploration of Pharyngo-Laryngeal Functions for a Comprehensive Assessment of Swallowing: A Sensor Selection Procedure from scoping review

    Agence National de la Recherche (ANR). 2024

    Accès: https://hal.science/hal-05103044v1

  • Séverin Baroudi, Hervé Bredin, Alexis Plaquet, Thomas Pellegrini

    pyannote.audio speaker diarization pipeline at VoxSRC 2023

    IRIT – Institut de Recherche en Informatique de Toulouse. 2023

    Accès: https://hal.science/hal-04969548v1

  • Etienne Sicard, Anne Menin-Sicard

    La diadococinésie et son application en orthophonique clinique

    [Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

    Accès: https://hal.science/hal-02512856v1

  • Etienne Sicard, Anne Menin-Sicard

    Analyse de la qualité des phrases pour un bilan objectif de la parole

    [Rapport de recherche] INSA Toulouse. 2019

    Accès: https://hal.science/hal-02389764v2

  • Thomas Pellegrini, Céline Manenti, Julien Pinquier

    The IRIT-UPS system @ ZeroSpeech 2017

    [Research Report] IRIT. 2017

    Accès: https://hal.science/hal-03131886v1

  • Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

    Automatic identification of French regional accent

    [Rapport de recherche] IRIT. 2017

    Accès: https://hal.science/hal-03120304v1

  • Rapports

    contrats de l’équipe

    AcronymeTitreCadre FinancementResp. scDébut
    pyannote.mobile
    [Contrat terminé]
    On-device streaming speaker diarization

    Programmes européens (hors ERC et fonds structurels)
    2024
    TAPAS
    [Contrat terminé]
    Training Network on Automatic Processing of PAthological Speech

    Programmes européens (hors ERC et fonds structurels) Julie MAUCLAIR
    2017
    VICTORIA
    [Contrat terminé]
    Video analysis for Investigation of Criminal and TerrORIst Activities

    Programmes européens (hors ERC et fonds structurels) Philippe JOLY
    2017
    europa
    AcronymeTitreCadre FinancementResp. scDébut
    PhLEs-NID Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée

    Appels à projets ANR (hors PIA) Jérôme FARINAS
    2022
    SeRiouSLySegmentation, Regroupement, et Séparation des Locuteurs

    Autres financements publics sur appel à projets
    2022
    CHICA-AI Entraîner les compétences de compréhension en lecture des enfants avec une intelligence artificielle adaptée

    Appels à projets ANR (hors PIA) Thomas PELLEGRINI
    2023
    AMELIOREÉtude des mécanismes d’adaptation suite à l’amputation totale et partielle de la langue : description et modélisation des processus mis en place au niveau physiologique, linguistique et comportemental

    Autres financements publics sur appel à projets Jérôme FARINAS
    2024
    BLeRIOT Investigation du Bea, du Lisic, de Reseda et de l’Irit sur la transcription de parole aéronautique

    Appels à projets ANR (hors PIA) Julien PINQUIER

    2024
    Le Petit Camion Limiter l’occurrence de biais attentionnels dans les Centres de Traitement de l’Alerte

    Appels à projets ANR (hors PIA) Julien PINQUIER
    2025
    OLINPIC Restaurer la parole perturbée pour améliorer intelligibilité, la compréhensibilité et la communication

    Appels à projets ANR (hors PIA) Jérôme FARINAS
    2025
    TAPASCCOAdaptation et amélioration de la reconnaissance automatique de la parole spontanée après cancer oral ou oropharyngé dans la réhabilitation et l’évaluation de la communication

    Fondations, associations, mécénats Julien PINQUIER
    2025
    CONNECTS – RUGBI
    [Contrat terminé]
    aCtiONs eN faveur du dialogue entre rEcherChe eT Société : Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique

    Appels à projets ANR (hors PIA) Jérôme FARINAS
    2024
    ADAPT
    [Contrat terminé]
    Aide à l’Analyse et au Diagnostic de la Parole pathologique pour les Thérapeutes

    Institut Carnot Julien PINQUIER
    2023
    PATY
    [Contrat terminé]
    Plateforme de traitement de parole atypique

    Institut Carnot Jérôme FARINAS
    2021
    OSIRIM
    [Contrat terminé]
    Observatoire des Systèmes d’Indexation et de Recherche d’Informations

    Appels à projets internes à une tutelle Philippe JOLY
    2020
    Park-MSA
    [Contrat terminé]
    Park-MSA

    Institut Carnot Julie MAUCLAIR
    2020
    [Contrat terminé]Low-latency online speakerdiarization

    Fondations, associations, mécénats
    2020
    LabCom : ALAIA
    [Contrat terminé]
    Laboratoire Commun : Apprentissage des Langues Assisté par Intelligence Artificielle

    Appels à projets ANR (hors PIA) Isabelle FERRANÉ
    2019
    LinTo
    [Contrat terminé]
    Assistant vocal open-source respectueux des données personnelles pour l’entreprise

    Programme d’Investissements d’Avenir (PIA) Isabelle FERRANÉ
    2018
    LUDAU
    [Contrat terminé]
    Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond

    Appels à projets ANR (hors PIA) Thomas PELLEGRINI
    2018
    RUGBI
    [Contrat terminé]
    Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique

    Appels à projets ANR (hors PIA) Jérôme FARINAS
    2018
    Toulouse mind & brain institut – Bourse de stage
    [Contrat terminé]
    AAP Toulouse mind & brain institut – TMBI : Réalisation d’une plateforme logicielle pour l’analyse et la mesure de la dysfluence prosodique en parole pathologique

    Autres financements publics sur appel à projets Jérôme FARINAS
    2018
    Toulouse mind & brain institut – TMBI – Bourse de stage
    [Contrat terminé]
    AAP Toulouse mind & brain institut – TMBI : Spiking neural networks for bird song detection

    Autres financements publics sur appel à projets Thomas PELLEGRINI
    2018
    ECREME (complément de financement)
    [Contrat terminé]
    Complément de financement Allocation Doctorale UFT : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE

    Autres financements publics sur appel à projets Julien PINQUIER
    2017
    VOICE4PD – MSA
    [Contrat terminé]
    Diagnostic différentiel entre la maladie de Parkinson et l’atrophie multisystématisée par analyse numérique de la parole

    Appels à projets ANR (hors PIA) Julie MAUCLAIR
    2016
    C2SI
    [Contrat terminé]
    Carcinologic Speech Severity Index Mesure , de l’impact des traitements des cancers de la cavité buccale et du pharynx sur la production de la parole par l’indice de sévérité des troubles de la production de la parole

    Autres financements publics sur appel à projets Jérôme FARINAS
    2015
    CIESS
    [Contrat terminé]
    Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement

    Appels à projets ANR (hors PIA) Régine ANDRÉ-OBRECHT
    2013
    DIADEMS
    [Contrat terminé]
    Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores

    Appels à projets ANR (hors PIA) Régine ANDRÉ-OBRECHT
    2013
    anr anr
    AcronymeTitreCadre FinancementResp. scDébut
    AUDIOCAP
    [Contrat terminé]
    Audition et handicap dans le bruit – vers la restauration de l’intelligibilité de la parole

    Fonds structurels européens Julien PINQUIER
    2019
    EVOLEX2
    [Contrat terminé]
    Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers

    Fonds structurels européens Julien PINQUIER
    2019
    INGPRO
    [Contrat terminé]
    Incidence des gestes sur la prononciation

    Collectivités territoriales Isabelle FERRANÉ
    2019
    SAMI
    [Contrat terminé]
    Allocation Doctorale : Système automatisé de mesure de l’intelligibilité

    Collectivités territoriales Julien PINQUIER
    2018
    ECREME
    [Contrat terminé]
    Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE

    Collectivités territoriales Julien PINQUIER
    2017
    PHONICS
    [Contrat terminé]
    CLE : Intelligent Electronic Device for Measuring Speech Comprehension

    Collectivités territoriales Jérôme FARINAS
    2014
    europa
    Jeudi 4 Décembre 2025, 13h30
    Contributions à l’entrainement du modèle neuronal de segmentation en locuteurs et son impact sur leur regroupement
    Alexis PLAQUET – Equipe SAMOVA, IRIT UT Site Rangueil, IRIT, Auditorium J. Herbrand
    #these
    Vendredi 4 Octobre 2024, 9h00
    Analyse automatique de signaux d’auscultation cervicale à haute résolution. Détection et caractérisation des déglutitions
    Lila GRAVELLIER – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Mercredi 3 Avril 2024, 9h00
    Description automatique des événements sonores par des méthodes d’apprentissage profond – CoNeTTE, un système d’Audio Captioning générique
    Etienne LABBÉ – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Vendredi 15 Mars 2024, 9h00
    Convolution Dilatée avec Espacements Apprenables
    Ismail KHALFAOUI HASSANI – Equipe SAMOVA, IRIT Centre de Recherche Cerveau et Cognition (CerCo), Toulouse
    #these
    Lundi 11 Mars 2024, 14h00
    Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues
    Verdiana DE FINO – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Mardi 16 Mai 2023, 10h00
    Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons
    Benjamin CHAMAND – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Mardi 21 Mars 2023, 9h00
    Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson
    Robin VAYSSE – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Mercredi 30 Novembre 2022, 14h00
    Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancers
    Sebastiao QUINTAS – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Lundi 17 Octobre 2022, 14h00
    Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?
    Estelle RANDRIA – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Jeudi 29 Septembre 2022, 14h00
    Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique
    Vincent ROGER – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Lundi 8 Juillet 2024 – Vendredi 12 Juillet 2024
    Conférence francophone JEP-TALN-RECITAL 2024
    UT2 Jean Jaurès
    #congres En savoir plus
    Jeudi 9 Janvier 2020 – Vendredi 10 Janvier 2020
    12th Speech In Noise Workshop
    Hôtel-Dieu Saint-Jacques, Toulouse
    #congres En savoir plus
    Lundi 4 Juillet 2016 – Vendredi 8 Juillet 2016
    Journées d’Etudes sur la Parole
    INALCO, 75013 Paris
    #congres En savoir plus
    Mercredi 17 Décembre 2025, 10h00 – 11h30
    Learning to Represent Audio: From Understanding to Guiding
    Changhong WANG – Télécom Paris (France) UT Site Rangueil, IRIT, Salle du Conseil
    #seminaire
    Jeudi 21 Février 2019, 11h00 – 12h00
    Weakly-supervised approaches for sound event detection
    Thomas PELLEGRINI – Equipe SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses
    #seminaire
    Mercredi 31 Août 2016, 10h00 – 12h00
    Advanced human robot social interaction: goals, challenges and approaches
    Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Lundi 9 Décembre 2024, 9h00
    Diagnostiquer la parole — caractérisation et modélisation automatique
    Julie MAUCLAIR – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #hdr
    Jeudi 21 Décembre 2023, 10h00
    La parole : du traitement automatique à la mesure de l’intelligibilité
    Jérôme FARINAS – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #hdr
    Jeudi 15 Juin 2023 – Samedi 17 Juin 2023
    9es Journées de Phonétique Clinique (JPC2023)
    UT2 Jean Jaurès, Maison de la Recherche
    #journee
    Jeudi 27 Mai 2021
    Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)
    UT3 Paul Sabatier, En visioconférence
    #journee
    Mercredi 4 Septembre 2019 – Vendredi 6 Septembre 2019
    Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Jeudi 4 Octobre 2018
    2018 AIRBUS Air Traffic Control Challenge Workshop
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Jeudi 8 Mars 2018
    Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Mercredi 4 Octobre 2017
    Workshop Language Didactics, Gestures & CALL
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee