La vidéo est-elle encore un outil pédagogique et en quoi la distingue-t-on du divertissement ?

Publié le 14/10/2025

Une interview de
Jean-Marie Cognet, CEO de Ubicast

La réponse est un grand oui, la vidéo reste une modalité pédagogique extrêmement pertinente. Aujourd’hui, on observe principalement la coexistence de deux grands formats. Le premier est une sorte de replay du présentiel. Il s’agit de la captation de cours en amphithéâtre, proposant des contenus longs d’une heure et demie à deux heures. L’objectif pour l’étudiant est de pouvoir revoir le cours auquel il a déjà assisté, afin de compléter ses notes ou d’approfondir des passages spécifiques. C’est un format de soutien, qui ne remplace pas le cours en direct.

Le second format est la capsule courte, une vidéo de 5 à 10 minutes conçue pour appréhender un concept précis. Elle peut être consultée avant ou après le cours pour bien intégrer une notion. Il est d’ailleurs communément admis qu’une vidéo pédagogique ne devrait pas dépasser 10 minutes, au risque de voir l’attention des apprenants décrocher.

La distinction avec le divertissement est fondamentale et repose sur plusieurs points. D’abord, l’intention : la vidéo pédagogique aide à apprendre, pas à se détendre. Ensuite, et c’est un indicateur clé, la durée d’attention n’est pas la même. Les données que nous observons chez Ubicast, aussi bien en France qu’aux Pays-Bas, en Belgique ou en Suisse, montrent que le temps de visionnage moyen d’un replay de cours d’1h30 est d’environ 20 minutes.

Les étudiants ne regardent pas le cours en intégralité d’une seule traite ; ils vont plutôt chercher des séquences spécifiques, souvent en vitesse accélérée. On est donc très loin de la durée d’un épisode de série (environ 1 heure) ou d’un film (2 heures), que l’on consomme pour le plaisir.

Les jeunes peuvent-ils aussi apprendre sur Tik-Tok ? et en quoi est-ce complémentaire de ce qu’ils apprennent à l’école ?

Mon parti pris est de dire clairement non, et ce pour deux raisons principales. La première est liée au format lui-même. Sur TikTok, les contenus qui fonctionnent durent moins de 10 secondes. Il est, à mon sens, impossible d’intégrer une connaissance solide et fondamentale en si peu de temps. On est dans le zapping, le survol de l’information, pas dans un processus d’apprentissage structuré.

La seconde raison est plus profonde : la dépendance aux algorithmes des plateformes. L’objectif d’un éditeur comme TikTok ou Instagram n’est pas philanthropique ; il n’est pas de vous élever par la connaissance. Leur but est commercial : vous faire rester le plus longtemps possible pour vous monétiser en tant qu’audience et aspirer vos données personnelles pour mieux cibler les contenus. L’objectif de la plateforme est donc contraire à celui de l’éducation. Même si l’on imaginait une succession de micro-contenus d’une minute pour traiter un sujet, on ne pourrait que survoler les choses, sans atteindre la profondeur requise par l’apprentissage académique. Il ne s’agit donc pas d’un outil complémentaire, mais plutôt d’une pratique qui relève purement du divertissement.

L’IA générative révolutionne-t-elle la production de vidéo pédagogique ?

L’intelligence artificielle est assurément une aide précieuse, mais il faut nuancer son impact. À l’heure actuelle, son principal apport ne se situe pas dans la production du cœur de la vidéo, mais plutôt en amont (pré-production) et en aval (post-production).

En amont, l’IA peut être très efficace pour préparer et structurer un script. Elle peut aider à définir un plan et à rédiger un premier jet de texte, ce qui représente un gain de temps considérable. Bien sûr, il est essentiel que l’humain retravaille ce texte pour se l’approprier, y injecter son style et son intelligence émotionnelle, et éviter les phrases génériques et impersonnelles que l’on reconnaît désormais très vite.

En aval, l’IA est extrêmement performante pour la post-production. Des tâches comme le sous-titrage, la traduction ou le montage (par exemple, couper les silences) sont grandement accélérées. Cela permet non seulement de gagner des heures de travail, mais aussi d’améliorer l’accessibilité numérique des contenus à moindre coût.

En revanche, pour la production elle-même, la technologie n’est pas encore mature. Les IA génératives de vidéo comme Veo (de Google) et Sora (de OpenAI) se limitent encore à des séquences de 10 à 15 secondes, un format inadapté à l’apprentissage. Les avatars, quant à eux, manquent encore de naturel ; leurs visages sont souvent figés et ils sont dépourvus de communication non verbale, ce qui est crucial pour l’engagement. De plus, l’IA peut commettre des erreurs, comme résumer un cours en supprimant des informations qui seront pourtant demandées à l’examen.

Ma vision est donc celle de l’humain augmenté, et non de l’humain remplacé. L’IA doit être un outil maîtrisé pour nous faire gagner du temps et nous permettre de nous concentrer sur notre véritable valeur ajoutée. Le risque, si l’on n’y prend garde, est de voir émerger des «charlatans» ou de «faux profs» qui produiraient des cours entièrement par IA sans aucune expertise réelle, ce qui pose une vraie question sur la différenciation et la qualité à l’avenir.

Quelle est votre vision sur l’équilibre entre l’image et le langage dans le futur de l’enseignement supérieur ?

Cette question est passionnante car elle touche au cœur de l’évolution pédagogique. La première révolution visuelle dans l’enseignement n’est pas venue avec la vidéo, mais bien avant, avec l’arrivée des rétroprojecteurs puis des vidéoprojecteurs dans les salles de classe. C’est à ce moment que nous sommes passés d’un enseignement purement oral à un apprentissage visuel, où les «slides» viennent illustrer et soutenir le propos de l’enseignant. La vidéo et le e-learning se sont inscrits dans ce continuum, qui a atteint son apogée durant la pandémie de Covid, où tout est devenu image et distantiel.

Cependant, je pense que nous assistons aujourd’hui à un rééquilibrage. L’avenir n’est ni dans le tout-image, ni dans le tout-langage, mais dans la recherche du meilleur des deux mondes. Un bon parcours pédagogique sera celui qui saura mixer intelligemment les modalités : des éléments visuels pour soutenir la compréhension (comme un graphique en statistiques qui a plus d’impact que des chiffres bruts), et des moments centrés sur le langage.

Le succès phénoménal du podcast est la preuve la plus éclatante de ce rééquilibrage. Le format audio, qui est du pur langage, connaît un essor fulgurant car il présente des avantages uniques. Premièrement, il a moins de contraintes que la vidéo : on peut l’écouter dans les transports ou en voiture, sans être rivé à un écran. Deuxièmement, il véhicule d’autres émotions ; l’absence d’image force une plus grande concentration sur la voix et ses intonations. Enfin, c’est un format beaucoup plus frugal, moins lourd et moins consommateur de bande passante.

En somme, si nous vivons dans une civilisation de l’image, cela ne signifie pas que le langage perd de sa valeur. Au contraire, dans un monde saturé d’images souvent synonymes de divertissement, le langage, et notamment l’audio, pourrait bien redevenir le média privilégié pour l’apprentissage profond et efficace.

Publié le 14/10/2025

Une interview de

Jean-Marie Cognet, CEO de Ubicast