Ajoutez un logo, un bouton, des réseaux sociaux
Le SON numérique
Nous traitons ici du son numérique et des procédés Dolby digital, DTS et SDDS au cinéma.
Au lieu de manipuler directement le son analogique, il est possible de coder les variations du signal électro-acoustique sous forme numérique. Ce codage numérique est binaire. C'est à dire que l'information n'a que deux formes, le 0 ou le 1 qui sont les éléments binaires (bits). C'est le langage utilisé dans l'électronique logique et c'est pourquoi le son rejoint l'informatique.
Le passage au numérique permet d'avoir une bande passante étendue, une dynamique accrue et de s'affranchir des phénomènes d'usure. Si l'information binaire est simple par elle même, elle fait appel à des systèmes d'une grande complexité.
Afin d'effectuer la conversion Analogique/Numérique on procède à deux opérations fondamentales que sont l'échantillonnage et la quantification. L'échantillonnage consiste à prélever périodiquement des échantillons du signal analogique. La fréquence à laquelle on procède à l'échantillonnage conditionne la bande passante du système. Ainsi la fréquence d'échantillonnage de 44,1 KHz du CD et de 48 KHz pour les systèmes professionnels offre une bande passante de 20 à 20.000 Hz.
La quantification consiste à donner une valeur numérique binaire à chaque échantillon. de l'échelle de quantification retenue dépend la dynamique du système, de même que plus cette échelle est grande plus elle sera précise. Un bit représente environ 6 dB de dynamique. Ainsi le CD avec des mots de 16 bits à une dynamique d'environ 96 dB et les systèmes professionnels actuels avec des mots de 24 bits auraient une dynamique de 144 dB (120 dB en pratique).
Cependant la conversion est loin d'être suffisante pour transmettre ou stocker le son numérique. Si l'information est rudimentaire dans sa forme (0 ou 1), elle est fondamentale pour la reconstitution du son. En effet si le signal analogique qui se détériore contient toujours le son, même tronqué, les éléments binaires qui disparaissent empêchent la reconstitution du son qui, du coup, disparaît avec eux. Afin d'éviter de tels incidents on introduit des codes de correction d'erreur avec de la redondance et de l'entrelacement d'information.
En dernier lieu on fait appel au format d'enregistrement. Ces codes tiennent comptes des contraintes physiques et mécaniques du support et permettent le stockage et la lecture du son numérique. Le format d'enregistrement diffère si il s'agit d'un CD, d'un DAT ou d'un disque dur.
On arrive ainsi à des systèmes dont l'information varie peu (0 et 1) mais avec des débits très importants. Par exemple le CD à un débit de 4,3 millions de bits par seconde.
Électronique logique: C'est celle des circuits intégrés basés sur le langage binaire.
Échantillonnage: (sampling) Sa fréquence définie la bande passante du système.
Quantification: Opération de codage binaire dont la précision définie la dynamique du système.
Entrelacement: l'information n'est pas traité dans l'ordre chronologique et permet la dispersion des erreurs au décodage.
La compression audio-numérique
Pour certaines applications comme la diffusion (télé, radio, internet) cette quantité d'information est un handicap. C'est le cas du cinéma avec 6 ou 8 canaux de diffusion et un support imposé. C'est pourquoi on s'est rapidement attaché à réduire le nombre d'information en comprimant le son numérique. Cette compression est un nouveau type de code, ou codec.
Pour réussir, cette compression doit être transparente et l'auditeur doit être incapable de la déceler. Pour atteindre cet objectif, la réduction de débit audio-numérique s'appuie sur les propriétés de l'oreille humaine. La psycho-acoustique et l'étude des sensations et perceptions auditives ont permis de mettre au point des systèmes de codage perceptuel du son.
Ils sont basés sur l'effet de masque. Un son précédé ou suivi par un autre son plus fort que lui sera en partie ou totalement masqué. Le niveau de masquage dépend du niveau du son masquant mais aussi de sa fréquence et de l'intervalle qui le sépare du son masqué. Il est normal que la fréquence intervienne dans l'effet de masque puisqu'il dépend directement de la sensibilité de l'oreille humaine. On peut faire une analogie entre cette inertie temporelle de perception auditive et la persistance rétinienne qui permet au mouvement cinématographique d'exister.
Appliqué à la compression audio-numérique, l'effet de masque permet de ne transmettre que les sons réellement détectés par l'oreille. Tous les sons masqués sont éliminés. Le codeur découpe le signal numérique en bande de fréquence (filtre en peigne) et analyse le niveau de masquage pour chaque bande. Il en déduit le niveau de quantification de chaque bande, où dit autrement, le nombre d'échantillons non masqués qui doit être transmis. On ne retient au final que l'information pertinente pour l'oreille de l'auditeur.
La compression permet de réduire le débit binaire dans un rapport de 1 à 6 et même 1 à 12. Soit une transmission de 25% à 8 % seulement du signal original. Elle tient compte de la fréquence d'échantillonnage (32 KHz radio DAB; 44,1 KHz CD; 48 KHz professionnel).
La compression la plus connue est sans conteste le MP3, ou MPEG couche III, mis au point par le CCETT en France et l'IRT en Allemagne.
Effet de masque: Un son plus fort masque un son plus forte.
Courbes isoniques: dites de Flechter & Munson, indiquent les niveaux de sensibilité aux différentes fréquences d'une oreille humaine moyenne.
CCETT: Centre Commun d'Études de Télédiffusion et Télécommunications.
IRT: Institut für RundfunkTechnik.
Contrairement aux autres supports audio-numérique, Le cinéma impose le type de support (principalement film 35 mm) et donc des contraintes physiques et mécaniques très spécifiques. Il est impossible par exemple de modifier la vitesse de défilement ou la taille du support. De même la taille des éléments binaires devra tenir compte des contraintes de définition de l'émulsion.
La première apparition d'une information numérique optique sur un film revient probablement au constructeur de caméra Aäton. Dans le code temporel Aäton l'information binaire se présente sous la forme d'un petit carré opaque ou translucide. Chacun de ces petits carrés est un caractère de l'information binaire.
Cette forme de codage numérique optique a été reprise depuis par tous les systèmes numériques du cinéma (CDS, Dolby DIGITAL & SDDS). Seul change la taille du caractère (de l'ordre de 15 µm de côté) et son emplacement sur le film.
La piste optique numérique, continue dans le cas du CDS, discontinue pour le Dolby DIGITAL, et continue et doublée pour le SDDS contient tous les canaux de diffusion (6 pour le 5.1 et 8 pour le 7.1) ainsi que d'autres informations comme du Time code ou du code midi ou encore des informations de service et metadata (titre du film, numéro de bobine...).
Outre l'information audio-numérique, la piste contient aussi les codes de correction d'erreurs, les codecs de compression et les codes liés au format d'enregistrement. On se rend compte que l'information est entrelacée et n'est donc absolument pas continue. Elle est plutôt constituée de blocs qu'il faut repérer, identifier et décoder.
C'est le rôle du format d'enregistrement qui tient compte des problèmes spécifiques liés au film. L'entraînement saccadé à la projection entraîne des fluctuations et du scintillement qu'il faut amortir. De même l'emplacement de la piste varie par rapport au lecteur son pour des raisons de couchage de la piste au moment du tirage en laboratoire et en raison de problème d'alignement mécanique sur le projecteur. Le format d'enregistrement va introduire un pistage vertical et un pistage horizontale ainsi qu'une redondance afin de pouvoir identifier chaque bloc.
Pour lire la piste et savoir si chaque caractère représente 1 ou 0, le lecteur éclaire un capteur CCD au travers de la piste. A chaque caractère numérique correspond une cellule du capteur CCD. Si le caractère est opaque la cellule n'est pas éclairée et inversement si le caractère est translucide. Ainsi le capteur CCD traduit électriquement l'information numérique qui sera corrigée, décompressée et convertie dans le décodeur correspondant à chaque système.
En 1977 Star Wars de G. Lucas est considéré comme le premier vrai film en Dolby Stéréo, même si c'est Apocalypse Now qui marquera le plus artistiquement. Ce procédé permet d'enregistrer 4 pistes sur les 2 pistes optiques du film 35 mm. Il utilise pour cela un matriçage 4:2 à l'enregistrement et un dématriçage 2:4 à la lecture avec l'ajout d'un réducteur de bruit de fond DolbyA. Le système s'impose petit à petit et s'améliore encore en 1986 avec le réducteur de bruit de fond DolbySR (Spectral Recording).
A défaut d'être très stable techniquement, à cause du matriçage délicat des pistes optiques, le Dolby Stéréo le sera commercialement. C'est le principal avantage de ce système qui devient une norme de fait. Son succès permet de banaliser l'utilisation du son multicanal au cinéma et grâce à lui le parc des salles de cinéma est prêt pour l'arrivée du son numérique.
Avec l'arrivée du disque compact audio, le son numérique, dont le principe a été exposé avant la guerre, devient réalité. Mais pour pouvoir être appliqué au cinéma il faut attendre le développement de la compression numérique. En effet le cinéma à plus de piste que le disque et le flux d'information est beaucoup trop important. Pour le réduire on va mettre au point des algorithmes de compression (ou calculs mathématiques) qui utilisent les faiblesses de l'oreille et les effets psycho-acoustique. C'est le cas par exemple de la norme MP3. Au début des années 1990 tout est donc réuni pour que le cinéma fête ses cents ans avec le son numérique.
Comme en 1927 ce changement oppose le son sur un support séparé et le son sur la copie film. Par contre, à l'exception du procédé Sony, tous ont opté pour une sonorisation dite 5.1. C'est à dire 5 canaux séparés et un sixième spécialisé dans les très basses fréquences.
Code Aäton: code temporel de 80 bits/sec enregistré à la prise de vue sur la pellicule image.
C'est un procédé 5.1 sur support séparé. Un code temporel sur le film pilote un lecteur de CD-ROM. Le procédé peut fonctionner pour les copies 16, 35 et 70 mm et reste compatible avec le son analogique et les 2 autres procédés numériques. Il existe une extension du DTS en 6.1. Comme pour Dolby qui fut précurseur, un matriçage dans les pistes d'ambiance permet de faire ressortir une piste ambiance arrière. Cette variante s'appelle DTS ES.
Le code est lu en avance sur la fenêtre de projection du film. Cette avance permet de vérifier la cohésion du code temporel pour garder un synchronisme parfait. elle permet aussi d'avoir une mémoire tampon qui aide au lissage des fluctuations de vitesse du projecteur film.
Le son sur le disque est compressé avec l'algorithme du MPEG AUDIO 2. Le MPEG réalise une analyse spectral en bande pour réaliser ensuite la compression des données. Le son est numérisé sur 16 bits avec une fréquence d'échantillonnage de 44,1 KHz. Sa dynamique est de 96 dB.
Le processeur cinéma DTS XD-10p lit les CD-ROM et permet de traiter les films analogiques Dolby A et SR. Il comporte une partie d'égalisation pour la sonorisation de la salle (réglage Chaîne B).
Le gros avantage du disque séparé est de s'affranchir des problèmes liés au tirage des copies. Il permet aussi pour un moindre coût d'avoir pour une seule copie image le son en Version Française et en Version Originale car il est possible de projeter en direct les sous-titres sur l'écran. Rien n'empêche pour une salle de cinéma de proposer VF et VO la même journée.
MPEG: (Moving Pictures Experts Group) Le MPEG 1, 2, & 3 est la compression audio-numérique normalisée par l'ISO (International Organization for Standardization)
Chaîne B: C'est la partie allant du réglage de niveau à la zone d'écoute de la salle définie dans la normalisation ISO.
C'est un procédé 5.1 sur support séparé. Un code temporel sur le film pilote un lecteur de CD-ROM. Le procédé peut fonctionner pour les copies 16, 35 et 70 mm et reste compatible avec le son analogique et les 2 autres procédés numériques. Il existe une extension du DTS en 6.1. Comme pour Dolby qui fut précurseur, un matriçage dans les pistes d'ambiance permet de faire ressortir une piste ambiance arrière. Cette variante s'appelle DTS ES.
Le code est lu en avance sur la fenêtre de projection du film. Cette avance permet de vérifier la cohésion du code temporel pour garder un synchronisme parfait. elle permet aussi d'avoir une mémoire tampon qui aide au lissage des fluctuations de vitesse du projecteur film.
Le son sur le disque est compressé avec l'algorithme du MPEG AUDIO 2. Le MPEG réalise une analyse spectral en bande pour réaliser ensuite la compression des données. Le son est numérisé sur 16 bits avec une fréquence d'échantillonnage de 44,1 KHz. Sa dynamique est de 96 dB.
Le processeur cinéma DTS XD-10p lit les CD-ROM et permet de traiter les films analogiques Dolby A et SR. Il comporte une partie d'égalisation pour la sonorisation de la salle (réglage Chaîne B).
Le gros avantage du disque séparé est de s'affranchir des problèmes liés au tirage des copies. Il permet aussi pour un moindre coût d'avoir pour une seule copie image le son en Version Française et en Version Originale car il est possible de projeter en direct les sous-titres sur l'écran. Rien n'empêche pour une salle de cinéma de proposer VF et VO la même journée.
AC-3: algorithme de compression de 2me génération dérivé de l'AC-2 mis au point par Dolby pour le cinéma.
Le Sony Dynamic Digital Sound. SDDS ®
C'est un procédé 7.1 avec 2 pistes optiques numériques sur les manchettes du film. Les pistes sont lues par un lecteur son CCD et traitées par le décodeur SDDS. Le procédé peut fonctionner pour les copies 35 et 70 mm et reste compatible avec le son analogique et les 2 autres procédés numériques.
Le codec de compression numérique est l'ATRAC mis au point par Sony pour le mini-disc . Il traite chaque canal séparément après une analyse spectral en bandes et sous-bandes. A l'image des logiciels informatique l'algorithme de compression est évolutif. Aujourd'hui il travail en 24 bits ce qui lui confère de très bons résultats dans les bas niveaux pour un signal numérique d'origine à 16 bits. Son taux de compression est de 1 à 5. Le son est numérisé à partir d'un signal PCM de 16 bits à 24 bits avec une fréquence d'échantillonnage de 48 KHz.Sa dynamique est de 85 dB.
Le processeur cinéma Sony DFP-3000 permet de traiter les films analogiques Dolby A et SR et décode les films SDDS. Il a aussi une partie d'égalisation pour la sonorisation de la salle (Chaîne B).
ATRAC: (Adaptive Transform Acoustic Coding) codage par transformation acoustique adaptative
Le passage au son numérique au cinéma a permis un bond en avant qualitatif certain. Les trois concurrents qui s'affrontent n'ont pas de différence qualitative marquante. Seul diffère les problèmes d'exploitation et les variations de coût. C'est plutôt d'une bataille commerciale dont il est question. D'ailleurs chaque procédé à bien pris soin de pouvoir cohabiter sur le film qui héberge simultanément une piste optique analogique et 3 procédés numériques.