BLOG I Pensez à l’accessibilité, sous-titrez et transcrivez vos vidéos !

28/08/2023

En 2022, Klee Group a obtenu le label Numérique Responsable (niveau 2) de l’Agence LUCIE pour une société meilleure et plus inclusive. Klee interactive, agence web de Klee Group,  partage son expertise sur l'accessibilité numérique avec des astuces pour générer facilement et rapidement des sous titres pertinents pour une vidéo.  

Avoir un site accessible ça n’est pas une mince affaire.
Vous souhaitez ajouter du contenu vidéo mais vous ne savez pas comment créer des sous-titres et des transcriptions ?

Dans cet article, nous vous parlerons de plusieurs solutions / outils que nous avons testés pour vous et qui vous feront gagner du temps.

Prendre en compte l’accessibilité numérique sur son site est important.
En effet, toute une partie du RGAA (Référentiel Général de l’Amélioration de l’Accessibilité), concerne les médias temporels c’est-à-dire les  vidéos et les fichiers audios.

Chaque média temporel synchronisé pré-enregistré a-t-il, si nécessaire, des sous-titres synchronisés (hors cas particuliers) ?

Critère 4.3 du RGAA v4.1

Ces vidéos, podcasts que nous créons ou qui sont hébergés sur des sites ou des applications dont nous assurons le bon fonctionnement et la conformité, doivent respecter plusieurs critères dont celui d’avoir des sous titres synchronisés, pertinents et dans la langue parlée.

Afin de vous aider à créer des sous titres efficaces et rapidement, des outils existent (le site d'Emmanuelle ABOAF rassemble beaucoup d'outils).
Certains sont payants comme oTranscribe, Sonix, … Nous allons dans cet article nous focaliser sur deux en particulier.

Whisper

terminal de commande

C’est une application open source qui utilise OpenAI. A partir d’un fichier audio, l’application retranscrit directement ce qu’elle entend, que le son soit en français ou en anglais !

Elle est totalement gratuite et est aussi accessible pour mac. Cependant, cette application, nécessite une installation manuelle en ligne de commande, ce qui demande des compétences techniques.

Cet outil n’est pas « magique » et demande une relecture du texte généré pour être certain que les sous-titres soient pertinents et correspondent aux paroles. Il faut être particulièrement vigilant sur les acronymes et les noms propres.

exemple de ligne de code et de transcription

Exemple de ligne de code et de transcription

Résultat d'une transcription :

Nous avons mis environ 1h pour transcrire un fichier audio de 20 minutes mais le programme utilise les ressources de votre ordinateur et est donc dépendant de votre RAM (mémoire vide).

L'accessibilité, ça va être l'art de rendre votre site ou vos applications, toutes vos créations accessible par toutes les personnes qui ont des handicap, ça peut être on pense directement au handicap visuel, ça peut être par exemple ceux qui sont d'altoniens, ça peut être ceux qui ont des problèmes de vue, …

Sur un petit extrait nous pouvons apercevoir quelques fautes de compréhension et de conjugaison. D’altoniens au lieu de Daltoniens, il manque un s à accessible.
 
Cependant, nous pouvons remarquer que la transcription est qualitative.

En effet, dans la piste audio originale, le narrateur commet quelques fautes de prononciation à plusieurs reprises. Dans la transcription de Whisper, ces erreurs ont été corrigées. La transcription est intelligente et a su analyser les phrases afin de les corriger.  

Cet outil n’est donc pas « magique » et une relecture est nécessaire pour être certain que les sous-titres soient pertinents et correspondent bien aux paroles. Néanmoins, il faut être particulièrement vigilant concernant les acronymes et les noms propres.

Des traductions possibles :

Avec l'idée de traduction, nous sortons clairement de l'application de l'accessibilité web et du RGAA. Cependant, il est intéressant de noter que Whisper propose plusieurs options comme la possibilité de traduire directement dans un large choix de langues (nous n'avons pas testé cette fonctionnalité).

Pour résumer :

Les points forts :

  • Performant
  • Fonctionne avec des personnes ayant des accents
  • Corrige certaines erreurs de prononciation
  • Le bonus : la traduction de textes est possible

Les points faibles :

  • Trop technique à mettre en place
  • Utilisable seulement avec des lignes de commande donc n’est pas à la portée de tous

Word

Il est aussi possible de retranscrire un fichier audio avec le logiciel Word pour le web. Le client lourd ne dispose pas encore de cette fonctionnalité. 

Vous pouvez charger un fichier audio préenregistré, puis transcrire l’enregistrement. Les formats pris en compte sont : .wav, .mp4, .m4a .mp3.

COMMENT FAIRE :

  1. Accédez à la liste déroulante « Accueil > Dicter > Transcrire ».
  2. Dans le volet Transcrire, sélectionnez « Charger l’audio ».
  3. Sélectionnez « Charger l’audio ».

Le site Microsoft est vraiment bien détaillé et explique clairement la marche à suivre.

transcription tuto

NOTRE ANALYSE :

Word est un outil que l'on connait et que la plupart d'entre nous utilise au quotidien.
Le fait que ce logiciel offre une transcription sans avoir à installer de nouveau logiciel est vraiment pratique.

Cependant il faut faire attention, la possibilité de transcription n'est disponible que sur Word pour le web.

RÉSULTAT D'UNE TRANSCRIPTION :

Pour le même fichier audio que nous avons utilisé pour Whisper,
Word a mis moins d’une minute à transcrire le fichier de 20 minutes (alors que Whisper a mis 1h).
Nous avons trouvé la transcription très rapide, malgré le fait que Microsoft avait indiqué que la transcription pouvait être longue, (parfois autant de temps que la durée de l’audio).
Nous avons la possibilité de rejouer l’audio pas à pas, afin de vérifier, retravailler la transcription et de renommer le fichier final.  
Cette fois, la transcription des sous-titres a été faite mot pour mot : toutes les fautes de prononciations ont été retranscrites. La transcription est donc totalement fidèle à l'audio.

Néanmoins, comme pour Whisper, le logiciel a réalisé quelques erreurs de transcription sur des mots mal compris et des coupures de phrases.

L'accessibilité, ça va être l'art de rendre votre site et. Vos applications toutes vos créations accessibles par tous les personnes qui ont des enfants, ça peut. Être des formes directement entière, ********, ça peut. Par exemple, daltonien, ça peut être ceux qui ont des.

Il semblerait que la qualité des sous-titres va dépendre de la qualité du fichier audio. 
Un fichier avec des bruits de fond entrainera des répercussions sur le texte.
L'articulation et la prononciation ont également un gros impact.
Lors de nos tests, il est arrivé que le service de transcription ne fonctionne pas, nous empêchant totalement de réaliser une transcription.
Le message d’erreur n’étant pas clair sur la raison de la non-transcription, nous nous sommes retrouvés bloqués.
L’utilisateur est donc dépendant du bon fonctionnement du service en ligne étant donné que rien n’est installé sur sa machine.

Pour résumer :

Les points forts :

  • Word est un outil que l'on connait/maitrise
  • Pas d'installation de nouveau logiciel
  • Simple d'utilisation

Les points faibles :

  • Service capricieux, il est parfois impossible de transcrire un fichier sans raison claire
  • Disponible sur Word pour le web uniquement
  • Utilisable seulement sur Edge et Chrome
     

CONCLUSION

Ces outils sont une aide précieuse afin de rendre vos vidéos accessibles. Cependant, une intervention humaine pour la relecture reste indispensable.

Les nouvelles IA (Intelligence Artificielle) permettent des sous titres "rapides" (plus rapide qu'un humain qui réécrirait tout) de longues vidéos.
Elles peuvent devenir rapidement un véritable allié.

Encore loin de la réflexion et de l'analyse d'un être humain, L'IA cependant fait le plus gros du travail et nous laisse à nous, le soin de vérifier/corriger et améliorer ce contenu.

En résumé :

Nous vous conseillons d’utiliser Whisper qui est très efficace contrairement à l’outil Word qui est très aléatoire et donc à éviter si vous voulez gagner du temps. 

Youtube offre également un bon système de sous titrage automatique via Youtube Studio. Une démonstration lors du webinaire d'Ideance pour la GAAD (Global Accessibility Awareness Day) est disponible sur le blog Ideance

Lors d’un audit, ces points vidéos/audios sont souvent du côté client alors qu’ils ont un fort impact sur le taux de conformités au RGAA. Il est indispensable afin d'  un site accessible, de travailler ces contenus.

Pour aller plus loin :

Les sous titres et transcriptions ne sont pas les seuls éléments ayant un impact sur l’accessibilité de votre site.

Le lecteur vidéo et audio a une grande importance. Nous vous conseillons d’utiliser des lecteurs qui soient accessibles au clavier et ayant de bonnes restitutions aux lecteurs d’écran tels que Youtube, Brightcove ou Vidéo.js.

Ce choix, souvent fait côté client, est un élément très important pour l’accessibilité.

Si vous souhaitez montrer un exemple concret à vos clients, le site gouvernemental « service-public.fr », est totalement conforme (avec un taux de conformité au RGAA de 100%) et utilise le lecteur Youtube.
 

Source : Brightcovevidéo.jsBlog de Sophie Drouvroy, MicrosoftWhisperGithub Whisper

  • Par Marjorie Mornet Gacoin

    Klee Interactive

    Intégratrice Web senior, Consultante en accessibilité numérique

    Suivre