About Me

avatar

I’m a researcher working on spoken and natural language processing issues. Interested in computer science and artificial intelligence, I defended my PhD thesis on “Spoken language understanding in human-computer dialogue systems in the era of pretrained models” in Le Mans University (France).

I am currently working at INA, the French National Audiovisual Institute, as a researcher on speech issues related to audiovisual contents. My current main research interest are Automatic Speech Recognition (ASR), speech and speaker recognition, and end-to-end information extraction.

Publications

    2024

  1. Valentin Pelloin, Lena Dodson, Émile Chapuis, Nicolas Hervé, David Doukhan (2024). Automatic Classification of News Subjects in Broadcast News: Application to a Gender Bias Representation Analysis. In Interspeech 2024, Kos, Greece. PDF · DOI · BibTeX
  2. David Doukhan, Lena Dodson, Manon Conan, Valentin Pelloin, Aurélien Clamouse, Mélina Lepape, Géraldine Van Hille, Cécile Méadel, Marlène Coulomb-Gully (2024). Gender Representation in TV and Radio: Automatic Information Extraction methods versus Manual Analyses. In Interspeech 2024, Kos, Greece. PDF · DOI · BibTeX
  3. Valentin Pelloin (2024). La compréhension de la parole dans les systèmes de dialogues humain-machine à l'heure des modèles pré-entraînés. In Le Mans University (PhD thesis). PDF · HAL · BibTeX
  4. 2022

  5. Gaëlle Laperrière, Valentin Pelloin, Mickaël Rouvier, Themos Stafylakis and Yannick Estève (2022). On the Use of Semantically-Aligned Speech Representations for Spoken Language Understanding. In SLT 2022, Doha, Qatar. PDF · DOI · BibTeX
  6. Valentin Pelloin, Franck Dary, Nicolas Herve, Benoit Favre, Nathalie Camelin, Antoine Laurent and Laurent Besacier (2022). ASR-Generated Text for Language Model Pre-training Applied to Speech Tasks. In Interspeech 2022, Incheon, South Korea. PDF · DOI · BibTeX
  7. Nicolas Hervé, Valentin Pelloin, Benoit Favre, Franck Dary, Antoine Laurent, Sylvain Meignier and Laurent Besacier (2022). Using ASR-Generated Text for Spoken Language Modeling. In ACL 2022 - Workshop on Challenges & Perspectives in Creating Large Language Models (Association for Computational Linguistics), Dublin, Ireland. PDF · DOI · BibTeX
  8. Gaëlle Laperrière, Valentin Pelloin, Antoine Caubrière, Salima Mdhaffar, Nathalie Camelin, Sahar Ghannay, Bassam Jabaian and Yannick Estève (2022). The Spoken Language Understanding MEDIA Benchmark Dataset in the Era of Deep Learning: data updates, training and evaluation tools. In LREC 2022 - Language Resources and Evaluation Conference 2022, Marseille, France. PDF · HAL · BibTeX
  9. Salima Mdhaffar, Valentin Pelloin, Antoine Caubrière, Gaëlle Laperriere, Sahar Ghannay, Bassam Jabaian, Nathalie Camelin and Yannick Estève (2022). Impact Analysis of the Use of Speech and Language Models Pretrained by Self-Supersivion for Spoken Language Understanding. In LREC 2022 - Language Resources and Evaluation Conference 2022, Marseille, France. PDF · HAL · BibTeX
  10. Valentin Pelloin, Nathalie Camelin, Antoine Laurent, Renato De Mori and Sylvain Meignier (2022). Architectures neuronales bout-en-bout pour la compréhension de la parole. In JEP 2022 - Journées d'Études sur la Parole 2022, Noirmoutier, France. PDF · DOI · HAL · BibTeX
  11. Gaëlle Laperrière, Valentin Pelloin, Antoine Caubrière, Salima Mdhaffar, Nathalie Camelin, Sahar Ghannay, Bassam Jabaian and Yannick Estève (2022). Le benchmark MEDIA revisité : données, outils et évaluation dans un contexte d’apprentissage profond. In JEP 2022 - Journées d'Études sur la Parole 2022, Noirmoutier, France. PDF · DOI · HAL · BibTeX
  12. 2021

  13. Valentin Pelloin, Nathalie Camelin, Antoine Laurent, Renato de Mori, Antoine Caubrière, Yannick Estève and Sylvain Meignier (2021). End2End Acoustic to Semantic Transduction. In ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). PDF · DOI · BibTeX
  14. 2020

  15. Coralie Reutenauer, Luce Lefeuvre, Aurélie Fouqueray, Thibault Prouteau, Valentin Pelloin, Cédric Lopez, Camelin Nathalie, Frédérique Segond, Dugué Nicolas and Didier Bourigault (2020). Technologies sémantiques et accès à l’information dans le prescrit SNCF. In 22ème Congrès de Maîtrise des Risques et de Sûreté de Fonctionnement, Institut pour la Maîtrise des Risques, Oct 2020, Le Havre (e-congrès), France. PDF · HAL · BibTeX
  16. Valentin Pelloin and Thibault Prouteau (2020). Apprentissage de plongements de mots sur des corpus en langue de spécialité : une étude d’impact. In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL, 22e édition). PDF · HAL · BibTeX

Other work