Pour chaque média temporel pré-enregistré ayant une transcription textuelle ou une audiodescription synchronisée, celles-ci sont-elles pertinentes (hors cas particuliers) ?
Vous avez ajouté une transcription à votre vidéo — c’est une bonne chose. Mais si cette transcription écrit « [Musique] » sans retranscrire les paroles, ou décrit vaguement « une personne explique quelque chose » sans rapporter ce qu’elle dit, l’utilisateur sourd ou aveugle repart les mains vides. Présence ne vaut pas pertinence.
La pertinence signifie que la transcription ou l’audiodescription transmet les mêmes informations que le média original. Pour un fichier audio : chaque mot prononcé, chaque son porteur de sens. Pour une vidéo sans piste audio : les gestes, les textes affichés à l’écran, les expressions qui changent le sens du message. Rien d’essentiel ne doit manquer.
Le critère 4.2 couvre trois situations. Les médias seulement audio (podcasts, enregistrements vocaux) doivent avoir une transcription fidèle. Les médias seulement vidéo (animations muettes, présentations sans narration) peuvent s’appuyer soit sur une transcription textuelle, soit sur une audiodescription synchronisée. Les médias synchronisés (vidéos avec son et image) doivent proposer l’un de ces deux dispositifs, pertinent dans les deux cas.
Ce critère est qualificatif : il évalue ce que vous avez fourni, pas si vous l’avez fourni. Une audiodescription qui se contente de dire « le présentateur montre un graphique » sans en décrire le contenu échoue au même titre qu’une transcription lacunaire.
3 tests pour évaluer la fidélité de la transcription textuelle
Pertinence de la transcription audio seulement
Ce test cible les fichiers audio purs (podcasts, enregistrements, interviews audio) qui disposent déjà d’une transcription textuelle.
- Identifiez tous les médias seulement audio de la page qui ont une transcription.
- Pour chaque média, lisez la transcription et écoutez l’audio en parallèle.
- Vérifiez que la transcription retranscrit :
- Tous les mots prononcés (pas de résumé ni de paraphrase).
- Les sons porteurs d’information (rires, applaudissements, alarme...) décrits entre crochets si nécessaire.
- L’identité des locuteurs si plusieurs personnes s’expriment.
- Si la transcription est fidèle et complète pour chaque média, le test est validé. Toute omission significative constitue un échec.
Pertinence de l'alternative à un média vidéo seulement
Ce test cible les vidéos sans piste audio (animations muettes, time-lapses, présentations sans narration) qui ont une transcription ou une audiodescription.
- Identifiez tous les médias seulement vidéo qui disposent d’au moins l’un de ces dispositifs : transcription textuelle, audiodescription synchronisée, audiodescription sur version alternative, ou version alternative audio.
- Pour chaque dispositif présent, évaluez sa pertinence :
- Transcription : décrit-elle toutes les informations visuelles (actions, textes à l’écran, données affichées) ?
- Audiodescription : décrit-elle précisément les éléments visuels significatifs, dans l’ordre chronologique ?
- Un seul dispositif pertinent suffit pour valider le test. Si aucun ne l’est, le test échoue.
Pertinence de l'alternative à un média synchronisé
Ce test cible les vidéos classiques avec son et image synchronisés (tutoriels, interviews filmées, reportages, publicités).
- Identifiez tous les médias synchronisés pré-enregistrés de la page.
- Pour chaque média, repérez le dispositif d’accessibilité présent : transcription textuelle, audiodescription synchronisée, ou audiodescription sur version alternative.
- Évaluez sa pertinence :
- Transcription : retranscrit-elle fidèlement les dialogues ET décrit-elle les informations visuelles essentielles non couvertes par l’audio (textes à l’écran, actions importantes, changements de contexte) ?
- Audiodescription : les éléments visuels significatifs sont-ils décrits dans les silences ou pauses du dialogue, avec suffisamment de précision pour être actionnables ?
- Un seul dispositif pertinent suffit. Si aucun ne l’est, le test échoue.
Exemples
❌ Non conforme : Transcription d’un podcast : résumé éditorial au lieu de retranscription
<!-- Podcast de 12 minutes sur la réforme de l'accessibilité numérique -->
<audio controls src="podcast-rgaa-reforme.mp3">
Votre navigateur ne supporte pas l'élément audio.
</audio>
<details>
<summary>Lire la transcription</summary>
<p>Dans cet épisode, nos experts discutent des nouvelles règles d'accessibilité
numérique et de leur impact sur les entreprises. Plusieurs points importants
sont abordés, notamment les délais de mise en conformité.</p>
</details>Ce texte est un résumé éditorial, pas une transcription. Il ne retranscrit pas les propos tenus, n’identifie pas les intervenants, et passe sous silence les dates, chiffres et exemples cités dans l’audio. Un utilisateur sourd qui s’appuie sur ce texte reçoit une fraction de l’information disponible aux autres auditeurs. Le test 4.2.1 échoue.
✅ Conforme : Transcription d’un podcast : fidèle, structurée, avec locuteurs identifiés
<!-- Podcast de 12 minutes sur la réforme de l'accessibilité numérique -->
<audio controls src="podcast-rgaa-reforme.mp3">
Votre navigateur ne supporte pas l'élément audio.
</audio>
<section aria-label="Transcription du podcast">
<h2>Transcription</h2>
<p><strong>Marie Dupont</strong> : Bonjour à tous. Aujourd’hui nous parlons du
décret du 24 juillet 2019 qui transpose la directive européenne 2016/2102
en droit français.</p>
<p><strong>Jean Martin</strong> : Exactement. La date limite pour les contenus
existants était le 23 septembre 2020. Les organismes qui n’ont pas mis à
jour leur site depuis cette date sont en infraction.</p>
<p>[Extrait sonore : jingle de transition]</p>
<p><strong>Marie Dupont</strong> : Venons-en aux sanctions prévues...</p>
</section>La transcription reproduit les échanges mot pour mot, identifie chaque locuteur et signale les sons non verbaux entre crochets. Un utilisateur sourd ou malentendant dispose exactement des mêmes informations qu’un auditeur. Le test 4.2.1 est validé.
❌ Non conforme : Audiodescription d’une vidéo synchronisée : descriptions trop vagues
<!-- Tutoriel vidéo : comment remplir un formulaire en ligne -->
<video controls>
<source src="tutoriel-formulaire.mp4" type="video/mp4">
<track kind="descriptions" src="descriptions.vtt" srclang="fr"
label="Audiodescription">
</video>
<!--
Contenu du fichier descriptions.vtt :
WEBVTT
00:00:05.000 --> 00:00:08.000
Le présentateur montre l'écran.
00:00:15.000 --> 00:00:20.000
Il clique sur quelque chose.
-->L’audiodescription dit « il clique sur quelque chose » sans préciser sur quoi ni pourquoi. Un utilisateur aveugle ne peut pas reproduire les actions décrites. La description doit nommer les éléments (« il clique sur le bouton ‘Étape suivante’, en bas à droite »), décrire ce qui s’affiche et indiquer les changements à l’écran. Le test 4.2.3 échoue.
Astuces et pièges
⚠️ Les sous-titres automatiques copiés-collés comme transcription
Exporter les sous-titres auto-générés de YouTube ou d’un outil d’IA et les coller dans un fichier texte ne constitue pas une transcription pertinente. Ces sous-titres contiennent des erreurs de reconnaissance vocale, ignorent la ponctuation, confondent les locuteurs et omettent les sons non verbaux. En audit RGAA, ils échouent systématiquement au critère 4.2. Une révision humaine est indispensable.
⚠️ Résumé vs transcription : l’erreur la plus fréquente en audit
Un résumé éditorial (« dans cette vidéo, nous abordons les points suivants... ») n’est pas une transcription textuelle au sens du RGAA. La transcription doit reproduire fidèlement le contenu : dialogues complets, textes affichés à l’écran, informations visuelles pertinentes. C’est l’écart le plus répandu dans les audits de sites institutionnels et d’administrations publiques.
💡 Tester la pertinence sans regarder la vidéo
Pour vérifier qu’une transcription est pertinente, lisez-la sans regarder ni écouter le média. Demandez-vous : est-ce que je comprends exactement la même chose qu’un spectateur qui aurait regardé la vidéo ? Si des informations manquent ou restent floues, la transcription est insuffisante. Cette méthode reproduit fidèlement l’expérience d’un utilisateur sourd ou aveugle.
⚠️ Vidéo seulement vidéo : transcription ou audiodescription, au choix
Pour les médias seulement vidéo (test 4.2.2), le RGAA accepte soit une transcription textuelle, soit une audiodescription synchronisée. Les deux ne sont pas requis simultanément. En pratique, une transcription textuelle est plus facile à produire, plus facile à indexer par les moteurs de recherche, et ne nécessite pas de retravailler la piste audio en cas de mise à jour du contenu.
⚠️ Cas particuliers : quand le critère ne s’applique pas
Le RGAA prévoit des exemptions pour les médias publiés avant le 23 septembre 2020, les contenus soumis à des droits tiers empêchant toute modification, et certains contenus diffusés en direct. Ces exemptions ne dispensent pas de fournir une transcription : elles permettent d’exclure le critère 4.2 du calcul du taux de conformité, à condition de documenter l’exemption dans la déclaration d’accessibilité.
💡 L’audiodescription doit s’intercaler dans les silences naturels
Une audiodescription pertinente ne coupe pas les dialogues : elle utilise les pauses naturelles de l’audio. Si la bande sonore originale ne laisse pas suffisamment de place, une version alternative avec audiodescription étendue est nécessaire. Indiquez clairement aux utilisateurs comment accéder à cette version, idéalement via un bouton ou un lien adjacent au lecteur.
Questions fréquentes
Qu'est-ce qui définit une transcription pertinente selon le critère RGAA 4.2 ?
Une transcription est pertinente quand elle permet à une personne qui ne peut pas accéder au média d’en obtenir l’intégralité du contenu. Pour un audio : tous les propos reproduits fidèlement, intervenants identifiés, sons informatifs mentionnés. Pour une vidéo : tous les éléments visuels porteurs d’information décrits. La question à se poser : la transcription remplace-t-elle complètement le média pour quelqu’un qui ne peut pas y accéder ? Si la réponse est non, elle n’est pas pertinente.
Comment traiter la musique de fond et les bruits d'ambiance dans une transcription RGAA ?
Seulement s’ils portent une information. Une musique de fond neutre n’a pas besoin d’être mentionnée. En revanche, si la musique change brusquement pour signaler un moment de tension dans un documentaire, ou si un bruit hors-champ (coup de feu, alarme, sonnerie de téléphone) est pertinent pour comprendre la scène, il doit figurer dans la transcription. La règle pratique : transcrivez ce qu’un auditeur entendant retirerait de ce son pour comprendre le contenu.
Comment auditer la pertinence d'une audiodescription dans le cadre du RGAA ?
Procédez en deux temps. D’abord, regardez la vidéo normalement et notez chaque élément visuel porteur d’information : textes incrustés, noms affichés, actions importantes, données visibles à l’écran. Ensuite, écoutez uniquement la bande son avec l’audiodescription sans regarder l’écran. Chaque élément de votre liste doit être couvert par l’audio. Ce qui manque est un défaut à signaler.
Comment le critère RGAA 4.2 s'applique-t-il à un média sans transcription existante ?
Non. Si aucune transcription ni audiodescription n’est présente alors qu’elle est requise, c’est le critère 4.1 qui est en échec. Le critère 4.2 ne s’évalue que sur les alternatives déjà fournies. Les deux critères peuvent donc être en échec simultanément, mais sur des médias différents : 4.1 sur ceux qui n’ont aucune alternative, 4.2 sur ceux dont l’alternative existe mais est insuffisante.
Quelles exigences de pertinence s'appliquent aux audiodescriptions étendues selon le RGAA ?
Oui. Le critère 4.2 porte sur la pertinence de l’audiodescription synchronisée, qu’elle soit standard ou étendue. L’audiodescription étendue (qui met la vidéo en pause pour insérer des descriptions longues) suit les mêmes règles : toutes les informations visuelles doivent être vocalisées. La distinction entre standard et étendue relève des critères 4.13 et 4.14 qui vérifient la présence de cette audiodescription étendue, pas sa qualité.