Pour donner un effet accéléré à une vidéo, il ne suffit pas de réduire le nombre d'images enregistrées chaque seconde, il faut aussi donner un aspect fluide à la scène enregistrée.
C'est le shutter (obturateur) qui permet de donner cet aspect fluide.
Si le shutter est ouvert trop peu de temps pour chaque image, les mouvements sembleront saccadés car chacune des images prise sera très nette.
Si le shutter est ouvert suffisement longtemps, les mouvements sembleront plus fluides mais chacune des images prises sera floue. (faites des pauses sur les vidéo pour comparer les images)
Démonstration :
Première vidéo, prise à vitesse normale, en mode full auto.
(Désolé pour la qualité du sujet, mais j'ai pris ce que j'avais sous la main ;-))
Deuxième vidéo, prise à 8 images par seconde avec un shutter réglé à 1/1000 de seconde
A vous de décider si les mouvements sont saccadés ou fluides.
Troisième vidéo, prise à la même vitesse (8 images/sec) mais avec le shutter réglé à 1/33 de seconde
Outre l'aspect plus fluide, vous avez dû noter la différence de qualité entre les deux vidéo.
Elles ont été tournée en intérieur par faible luminosité (environ 80lux)
Pour compenser le manque de luminosité dû à une vitesse de shutter trop élevée (1/1000 s), il a fallu mettre le gain (électronique) de la caméra à fond, ce qui a créé beaucoup de bruit.
La vidéo avec le shutter lent est plus belle pour cela : La lumière a le temps d'exiter le capteur dans la caméra.
Le problème aurait été inverse en extérieur un jour de grand beau temps. Pour obtenir l'effet fluide sans saturer le capteur de lumière, il aurait fallu alors utiliser le filtre neutre de la caméra. On attendra l'été pour faire la démonstration.
Un fichier vidéo est constitué d'un conteneur qui contient (on dit qui encapsule) les données audio et vidéo, les sous-titres,
etc...
Que ce soit pour gagner de la place ou pour diminuer le débit, les données audio et vidéo sont généralement compressées : Il faudrait plus d'1Go pour stocker 1mn de film en définition
standard...
Ce n'est pas le conteneur qui détermine le mode de compression mais le codec qui compresse dans un format normalisé.
Il existe deux modes de compression : La compression SANS perte (lossless) et la compression AVEC pertes (lossy)
La compression sans perte :
Les algorithmes de compression sans perte permettent de retrouver lors de la décompression toutes les données du fichier d'origine. Leur taux de compression est très faible et donc peu utilisé en vidéo.
La compression avec pertes :
Une fois la compression faite, des données sont définitivement perdues. Leur taux de compression peut être très élevé. La qualité de la vidéo finale diminue avec l'accroissement de la compression. Une trop grande compression peut créer des effets de blocs, de halo, de flou.
Une autre notion essentielle pour la compression vidéo est la notion de compression temporelle ou spatiale.
La compression spatiale cherche les similitudes sur une image et diminue la taille de cette image sans s'occuper des ressemblances avec les images d'avant et d'après. Or il y a la plupart du
temps une grande ressemblance entre deux images qui se suivent. On appelle compression temporelle le mode de compression qui cherche les ressemblances entres les images qui se suivent.
Les normes de compression Vidéo
Les principales normes de compression vidéo sont DV, MPEG1, MPEG2, MPEG4
DV : Dérivé de la norme MJPEG, le débit va de 25 à
100Mb/s suivant le niveau d'exigeance . Il existe de nombreuses variantes : DV, MiniDV, DVCAM (Sony), Digital8, DVCPRO (DVCPRO25, DVCPRO50 de Panasonic). Le miniDV est le format des
camescopes grand public.
Le support d'enregistrement est une cassette numérique
Le format d'image est 4/3 720 × 576 pixels à 25 FPS
Les couleurs sont traitées en YUV numérique
4:2:0 (l'information de luminance prend deux fois plus de place que la
chrominance dans le fichier et on diminue la précision des couleurs en vertical.) avec 8 bits par couleur.
La compression n'utilise qu'un algorithme de compression spatial (on dit aussi : intra-image)
Mauvaises performances pour l'incrustation.
La partie audio est au format PCM non compressé.
MPEG1 : C'était la norme du vidéo CD 1,15Mb/s avec une résolution de 360x288 (4/3). Cette norme réalise un compression spatiale et temporelle. Elle dispose d'une partie audio qui a donné naissance au format MP3. YUV numérique 4:2:0
MPEG2 : Évolution de la norme MPEG1, elle permet de stocker des vidéos au format SD ou HD en mode entrleacé ou progessif avec des débits allant de 3 à 50Mb/s. Utilisée pour les dvd, la tnt, la télévision par satellite, le câble. YUV numérique 4:2:2 (la bande passante de la chrominance est la moitié de celle de la luminance. Cela permet un gain de place et de débit pratiquement sans perte de qualité.
MPEG4 : C'est une famille de normes dont la plus efficace est l'AVC/H264 qui permet des débits allant de 600Kb/s (qualité équivalente VHS) à 30Mb/s (blue ray). C'est la norme utilisée pour les TV HD, TNT HD, ADSL. Cette norme demande une grande puissance de calcul.(YUV 4:2:0, 4:2:2, 4:4:4)
Les normes de compression Audio
Les principales normes de compression audio sont :
mp3 : sont vrai nom : MPEG-1/2 Audio Layer 3. C'est un codec lossly (voir au dessus) dont les performances accoustiques sont les suivantes : excellent de 224 à 320 kbit/s, très bon de 192 à 224 kbit/s, bon de 128 à 192 kbit/s.
AAC : Advanced Audio Coding. Codec plus récent et plus performant que le mp3. Lossly.
Performances : 48Kbit/s est presque équivalent à l'oreille que 128Kbit/s en mp3
ogg : Codec libre (on peut analyser l'algorithme) Lossless de qualité intermédiaire entre les deux premiers.
Flac : Free Lossless Audio Codec. Codec libre Lossless. Le son garde la qualité de l'original non compressé mais le débit, non réglable, peut monter à 1000Kbits/s.
Les conteneurs
Le conteneur englobe les flux audio et vidéo, gère la synchronisation, les sous-titres., etc... Les plus connus sont :
AVI : Audio Vidéo Interleaved. Format développé par Microsoft qui permet d'encapsuler une piste vidéo et jusqu'à 99 pistes audio.
ASF (wmv) : Format développé par Microsoft qui permet nottamment le streaming. Il stocke aussi des métadonnées (titre, année, genre, etc...)
MOV : C'est le format Quicktime développé par Apple
DVRAW : C'est le format qui encapsule les codecs de type DV
MPEG2-PS : Stockage sur dvd
MPEG2-TS : Utilisé pour la diffusion (broadcast). Gestion de flux plutôt que de fichiers
MP4 : Format normalisé qui date de 2004 et qui s'inspire directement de quicktime
FLV : Flash Video. Format utilisé pour diffuser des vidéos sur internet via le lecteur Flash.
MKV : Format ouvert récent et performant. Bien adapté à la HD, supporte pratiquement tous les types de flux, permet de mettre des pièces jointes,...
Suivant les besoins on peut avoir à passer d'un type de compression à un autre, d'un conteneur à un autre. Un outil très efficace pour manipuler et réencoder les fichiers vidéo est ffmpeg.
il en existe des sur-couches graphiques (WinFF, PyTube) mais c'est en ligne de commande que nous l'utiliserons.
Quelques exemples d'utilisation de ffmpeg :
| Support | Norme de compression vidéo | Taille de l'image | Débit vidéo | Norme de compression audio | Débit audio | conteneur |
| TV HD, blue ray |
Mpeg-4 H264 |
1980x1080 | 1Mb/s |
flac |
1Mb/s | mkv |
| CD | Mpeg4 | 512x288 | 900kb/s |
mp3 |
128kb/s |
avi |
| DVD |
Mpeg2-PS |
720x512 |
- |
- | - | mpg |
| Support | Commande à taper |
| TV HD | ffmpeg -i FichierSource.mov -acodec flac -vcodec libx264 -b 35000k -f matroska FichierDestination.mkv |
| CD | ffmpeg -i FichierSource.mov -acodec libmp3lame -ab 96k -vcodec mpeg4 -b 900k -f avi FichierDestination.avi |
| DVD | ffmpeg -i FichierSource.mov -target pal-dvd -aspect 16:9 -fs 2000000000 -sameq FichierDestinationi.mpg |
Avant de commencer le montage d'un clip vidéo, il faut définir les paramètres de sortie de la vidéo. (caractéristiques techniques de l'image que l'on veut
obtenir)
On accède à ces paramètres par le menu configuration>format ou par le racourci shift-f. On obtient alors la fenêtre suivante :
La partie qui nous intéresse aujourd'hui est celle qui concerne les réglages vidéo : toute la colonne de droite.
Dans cette colonne, les paramètres importants à régler sont les suivants :
Fréquence des images. (Frames per second : FPS. trames par seconde en français ).
C'est le nombre d'images par seconde de la vidéo.
Avec l'informatique on peut choisir n'importe quelle FPS mais il existe des standards et suivant le type de média auquel est destinée la vidéo (dvd, internet, tel,etc...), le choix sera plus ou moins restreint.
Voici quelques un des principaux choix à notre disposition :
PAL/SECAM : 25 FPS
C'est la norme utilisée sur nos téléviseurs analogiques. Elle est ancienne (1960). A l'époque il était difficile d'obtenir facilement une fréquence stable. Une source sûre était le secteur EDF
qui fournit une tension alternative à 50Hz précise (+/-0,1%). Comme l'oeil commence à percevoir un flux d'images continu à partir d'environ 20Hz, on s'est contenté pour des raisons techniques à
l'époque de 50/2=25 FPS. (le /2 vient de l'entrelacement, voir plus bas)
NTSC : 30 FPS
C'est la norme utilisée aux États-unis et au Japon pour les téléviseurs analogiques. Elle date de 1953. Aux États-unis la fréquence du secteur est de 60Hz. Pour les mêmes raisons on a
choisi une fréquence d'images de 30 FPS.
Cinéma : 24 FPS
Au cinéma, les films muets étaient à 16 FPS et les films sonores sont à 24 FPS
HD : 24/25/30/50/60 FPS
L'électronique actuelle permet de traiter une quantité de données beaucoup plus grande qu'il y a quelques années. Le standard du futur semble être 50/60
FPS. Valeur qui permet un très grand confort d'image, notamment pour les retransmissions sportives ou pour toutes les vidéos ou les objets sur l'image bougent vite.
Le rapport d'aspect (ratio) :
C'est le rapport entre la largeur et la hauteur de l'image. Là aussi, il faut savoir choisir suivant le support de destination. Les principaux ratios sont :
4/3 ou 1,33 (quatre divisé
par trois égale un virgule trente trois): format de la télévision pour les normes PAL/SECAM et NTSC. Il existe encore près de 40% de téléviseurs à ce ratio, il est néanmoins en perte de
vitesse et devrait pratiquement disparaître dans les années qui viennent. C'était aussi le premier format d'images du cinéma (vers 1910).
16/9 ou 1,78 : C'est le format de la télévision Haute définition (HD) et de la télévision numérique en général. C'est le principal format vidéo d'aujourd'hui.
Standard du cinéma pour les pellicules 35mm (introduit en 1953).
Format cinémascope/panavision : L'écran large du cinéma. L'image est réalisée avec des lentilles anamorphiques. La technologie date elle aussi du début des années 1950.
La taille de l'image :
Encore une fois il va falloir choisir entre de nombreuses propositions...
Voici les principales :
Le format SD (Standard definition)
Les tailles des formats SD sont dérivées des normes PAL/SECAM et NTSC pour un même ratio d'image (4/3) :
-> 720x480 (720 lignes horizontales et 480 pixels par ligne) pour un DVD destiné au NTSC
-> 720x576 pour un DVD destiné au PAL/SECAM.
Le format HD (Haute définition)
En haute définition le ratio est de 16/9 et les choix sont les suivants :
-> 1920x1080 : C'est la première taille créée, cette taille correspond aux normes 1080i et 1080p
-> 1280x720 : Plus récente et visuellement équivalente à la 1080i, cette taille correspond à la norme 720p
Le mode d'entrelacement :
Pour éviter l'effet de scintillement, on a eu l'idée d'entrelacer l'image. Au lieu d'afficher une image entière, un poste de télévision analogique (PAL ou NTSC) n'affiche que la moitié de l'image en ne prenant qu'une ligne sur deux. Au passage suivant on affiche l'autre moitié de l'image. Une fois les lignes paires, l'autre fois les lignes impaires. On obtient une demi-image à la fréquence du secteur en europe par exemple (50Hz) soit 50 demi-images par secondes ou 25 images secondes.
Les moyens techniques modernes permettent d'afficher sans difficulté des images entières à des fréquences beaucoup plus élevées. Ce mode d'affichage, utilisé pour les ordinateurs est le mode progressif.
Les normes analogiques (PAL/SECAM NTSC) n'utilisent que le mode entrelacé (interlaced) alors que certaines normes numériques permettent d'utiliser les deux pour des raisons de compatibilité. En numérique on ajoute donc un P pour progressive ou un I pour Interlaced.
Exemples : 1080i, 1080p, 720p (il n'y a pas de mode entrelacé dans cette dernière définition).
Modèle colorimétrique
La colorimétrie (Science de la mesure des couleurs) est un vaste domaine qui fera
l'objet d'un article séparé.
Le choix du modèle colorimétrique est très important pour la fluidité de la lecture vidéo pendant l'utilisation de cinelerra. Plus il est éloigné du modèle d'origine, plus l'ordinateur aura du travail.
Les deux grand types proposés par cinelerra sont RVB et YUV.
RVB signifie Rouge-Vert-Bleu (Red-Green-Blue = RGB).
La couleur obtenue est le résultat du mélange de ces trois composantes.
Il est disponible en codage sur 8 ou 32 bits par couleur.
-> Le modèle RVB sera à privilégier pour les vidéos non compressées
YUV est hérité de la télévision analogique et noir et blanc. Pour garder la compatibilité avec les téléviseurs noir et blanc, on a conçu un système qui séparre la luminance (intensité lumineuse) et la chrominance (couleur). Il est à trois composantes comme le système RVB mais définit une composante luminance et deux chrominance. Il est créé à partir d'une source RVB.
-> Le modèle YUV sera à privilégier pour les vidéos compressées
Le Canal Alpha
Pour chaque type (RVB oou YUV) ou aura la possibilité d'ajouter un canal alpha. On passe alors à RVBA et YUVA. Ce quatrième canal permet de travailler sur la transparence de l'image et de réaliser plus facilement des effets d'incrustation.
Les choix proposés par Cinelerra sont les suivants (voir le manuel):
| RVB8 (RGB8) |
8 bits par canal Faible plage dynamique (2⁸=256 nuances) Médias non compressés |
| RVBA8 (RGBA8) |
8 bits par canal Faible plage dynamique Médias non compressés Transparence, supperposition de pistes vidéos |
| RVB32 (RGB-Float) |
32 bits par canal plage dynamique élevée (2³²=4 294 967 296 nuances...) Médias non compressés |
| RVBA32 (RGBA-Float) |
32 bits par canal plage dynamique élevée Médias non compressés Transparence, supperposition de pistes vidéos |
| YUV |
8 bits par canal Faible plage dynamique Médias compressés |
| YUVA |
8 bits par canal Faible plage dynamique Médias compressés Transparence, supperposition de pistes vidéos |
Conclusion :
Les multiples normes, définitions et modes rendent les choix assez compliqués. Pour l'usage que nous en avons (nous n'avons pas de téléviseur analogique) nous allons abandonner la SD.
Il nous reste la HD dont les principaux formats sont :
1080i/25, 720p/50 : Ces deux formats nécessitent le même débit. Le 1080i/25 privilégie les détails de l'image alors que le 720p/50 privilégie les mouvements.
1080p/24 : Ce format est de plus en plus utilisé pour remplacer les pellicules 35mm des caméras de cinéma. Sa définition est suffisante pour assurer une bonne qualité d'image pour une projection en salle.
1080p/50 : C'est la HD ultime... qui nécessite un débit proche de 3Gb/s en non compressé. Il est temps de préparer un article sur la compression...
Je ne sais pas si tout ça est clair...
Petit tableau comparatif pour finir :
| Norme | Fréquence des images | Rapport d'aspect | Taille de l'image |
Modèle colorimétrique d'origine |
Mode d'entrelacement |
| PAL/SECAM | 25 | 4/3 | 720x480 |
YUV pour PAL YDbDr (dérivée de YUV) pour SECAM |
Entrelacé |
| NTSC | 30 |
4/3 |
720x576 | YUV | Entrelacé |
| 1080i/25 | 25 | 16/9 | 1920x1080 |
YUV ou RGB |
Entrelacé |
| 1080p/25 | 25 | 16/9 | 1920x1080 | YUV ou RGB | Progressif |
|
1080p/24 |
24 | 16/9 | 1920x1080 | YUV ou RGB | Progressif |
| 720p/50 | 50 | 16/9 | 1280x720 | YUV ou RGB | Progressif |
|
1080p/50 |
50 | 16/9 | 1920x1080 | YUV ou RGB | Progressif |
Quelques commandes clés à utiliser pour récupérer et utiliser les vidéos des camescopes avec cinelerra
Son
Lumière
Vidéo
Spectacle
Pédagogie