Jenfi Home-Studio

Your wishlist "music" to Santa Claus 2017?

Several possible choices
◄ 3 choice maximum ►

Participate to see the results.

Les connexions audio numériques

Les interfaces numériques

Connexion, transfert et synchronisation pour l'audio numérique

Même si aujourd'hui le numérique est omniprésent dans une majorité d'équipements, autant domestiques que spécialisés dans l'audio pour ce qui nous concerne, l'interconnexion et le dialogue n'est pas aussi simple et facile qu'en analogique. On pourrait être tenté de transposer nos habitudes prises en analogique sur le matériel digital, mais c'est plus compliqué qu'il n'y paraît. En effet, si c'est très simple de faire converser des machines analogiques en les reliant entre elles — quoique… —, c'est bien plus compliqué en numérique parce que les différents formats — les différents langages numériques — ne se comprennent pas forcément entre eux. Il faut que les appareils numériques dépendent de la même norme, le même format. A ce jour ne subsiste que trois grandes familles d'interfaces audionumériques à usage commun dans nos homes studio. Ce sont les formats AES3 (nommé couramment AES/EBU), S/PDIF dérivé du premier, et ADAT. Il y a plus de 22 ans, les formats étaient plus nombreux et compliquaient ou même interdisaient toute communication entre ces normes : Sony S-DIF et les interfaces DASH, Yamaha Y1 et MEL-2, Mitsubishi PD, par exemple. Heureusement, ces formats propriétaires ont disparu. Ne subsiste que les formats d'interfaces spécifiques aux fabricants Tascam avec le T-DIF et Roland et son R-BUS. Ces formats numériques sont exclusifs et limités à celui de la marque de l'équipement. Leur disparition dans les années à venir est à envisager… Aujourd'hui, nous pouvons distinguer les normes de transmissions numériques suivantes :

Je présente aussi le dialogue entre les formats, les patchbays ainsi que le signal de synchronisation et le décalage temporel (Jitter) qui y est associé :

Après la présentation des différentes normes numériques, j'ai ajouté un tableau sur les longueurs maximales préconisées pour les câbles numériques.


Les textes de cette page sont une compilation d'articles parus dans la presse spécialisée ou sur Internet sous la plume ou la souris de Rick AURICCHIO, François BARVEC, Gisèle CLARK, Franck ERNOULD, Robert HARLEY, Etienne LEMERY, Rémy MALLARD, Hugh ROBJOHNS; des sites AES.org, Alesis, Apogee, ART (Applied Research and Technology), Behringer, Digidesign, Focusrite, Klark Teknik, Presonus, Rane, RME, Roland, Sonelec-Musique, Sound On Sound, Tascam, Wikipedia, Yamaha. Si j'ai oublié quelqu'un, qu'il se manifeste et je l'ajouterai.

L'AES/EBU

Le format AES3 est une norme ouverte créée en collaboration entre l'AES (Audio Engineering Society) et EBU (European Broadcasting Union) en 1985 sous la référence IEC-60958 type I. Il est aussi appelé AES/EBU qui est celui de l'interface. Aujourd'hui, le format AES3 est très rependu dans le milieu professionnel. Ce standard a connu plusieurs évolutions, la dernière remonte à 2003. La variante “grand public” de l'AES3 est le format S/PDIF qui a été normalisé IEC-60958 type II. J'y reviendrai plus loin.

L'effet pelliculaire

C'est un phénomène électromagnétique — appelé aussi « effet de peau » — qui fait que lorsqu'un conducteur est traversé par un courant alternatif, les électrons tendent à se déplacer à sa surface et non en son centre. Au fur et à mesure que la fréquence augmente « l'épaisseur de pénétration » du courant à l'intérieur du conducteur diminue. Il provoque la décroissance de la densité de courant à mesure que l'on pénètre au cœur du conducteur. Il en résulte que la section de conducteur utilisé diminue aussi et que la résistance augmente (R=ρl/S). La section utile sera inversement proportionnelle à la fréquence. Ce phénomène d'origine électromagnétique existe pour tous les conducteurs parcourus par des courants alternatifs.

Câble 110 ohms XLR L'interface AES3 est matérialisée par des connexions XLR — dites “Canon” — à trois broches (XLR3-31 femelle et XLR3-32 mâle). Les câbles sont des paires torsadées de 110 ohms avec un écran total. Comme pour l'audio analogique classique, le signal sort par le connecteur mâle et entre par un connecteur femelle. Le câblage utilise la même convention : le blindage sur la broche 1 et le signal sur les broches 2 et 3. Mais contrairement à la connexion analogique sur XLR, l'AES3 fait transiter un signal stéréo ou deux canaux dans un seul câble. Les données AES3 sont transférées via un signal carré d'une amplitude pouvant attendre 7V crête à crête avec une fréquence de l'ordre de 1,5 MHz. A de telles fréquences, il se produit ce qui est appelé « l'effet pelliculaire » (cf. encart). Il est grandement recommandé d'utiliser un câble 110 ohms au lieu d'un simple câble micro pour faire communiquer des périphériques avec interface AES3 (AES/EBU). Dans le même temps (les années 80), la vidéo passe aussi au numérique. Mais là, le même type de câble et de connexion comme pour le signal vidéo analogique sont utilisés. Les liaisons sont réalisées avec des câbles coaxiaux de 75 ohms (asymétrique) et connecteurs BNC (connecteurs à baïonnette de verrouillage). Ce type de liaison donna des idées au groupe de normalisation audio. Ainsi, en 1995, l'AES a publié une mise à jour de l'interface AES3 en y ajoutant les connexions asymétriques utilisant des connecteurs BNC et des câbles coaxiaux de 75 ohms. Appelé AES3-id, elle a été largement adoptée dans les milieux professionnels, car les câbles permettent indifféremment de faire circuler de l'audio ou de la vidéo, suivant l'appareil sur lequel ils sont branchés bien entendu. La tension du signal est typiquement 1 V crête à crête, et la portée maximale prévue est donnée pour 1000 mètres.

Bien que certains appareils amateur ou semi-professionnel en soit équipé, l'interface AES/EBU est boudée des home-studios, le S/PDIF lui étant préféré. Ce choix est peut-être guidé par la présence de l'interface “grand public” S/PDIF quasi systématique sur les appareils audio et instruments de musique électronique produits aujourd'hui.

Prise RCA

Une prise RCA, ou connecteur RCA, ou prise cinch, ou encore connecteur cinch, est un connecteur électrique couramment utilisé dans le domaine audio et vidéo. Ces prises concentriques sont à chaque extrémité d'un câble coaxial. Elles sont constituées d'un doigt central, entouré d'un anneau métallique. L'anneau est souvent sous forme de sections, pour des raisons de flexibilité. Les connecteurs RCA femelles, que l'on trouve sur les appareils sont constitués d'un trou central entouré d'un cylindre métallique. Ce cylindre de la même taille que la partie mâle, permet une connexion mécanique et une connexion électrique correcte.

Le nom “RCA” est l'acronyme de « Radio Corporation of America ». RCA était une entreprise américaine dont le nom, qui appartient aujourd'hui à Thomson, est utilisé par Sony BMG Music Entertainment en tant que label discographique et par d'autres sociétés pour commercialiser des produits électroniques.

Le S/PDIF (ou SPDIF)

Câble 75 ohms RCA La version grand public de l'interface AES3 est connue sous l'acronyme S/PDIF (Sony / Philips Digital Interface). Elle est décrite sous la référence IEC-60958 Type II (initialement IEC-958). Electriquement, elle est très similaire au format AES3-id (même si elle lui est antérieure). Elle nécessite des câbles coaxiaux de 75 ohms terminés par des connecteurs phono CINCH appelés aussi fiches RCA (cf. encart "Prise RCA"). Cette connexion est souvent dénommée « COAXIAL S/PDIF ». La tension du signal est réduite à 0,5 V nominal crête-à-crête et la distance de transmission maximale est de 10 mètres maximum. Je vous conseille d'utiliser des câbles de 75 ohms adaptés à la place de simples câbles phono analogique qui y ressemblent à tous points de vues et qui pourrait sembler faire l'affaire. Bien que cela puisse fonctionner sur de courtes distances, l'interface S/PDIF sera beaucoup moins fiable et beaucoup plus sujettes au JITTER, décalage de l'horloge de synchronisation (lire ci-après). Les informations numériques S/PDIF sont transmises dans le câble à des fréquences étant de 2 Mhz (Fs = 32 kHz), 2,8 MHz (Fs = 44,1 kHz) et 3.1Mhz (Fs = 48 kHz). A de telles fréquences, il se produit ce qui est appelé « l'effet pelliculaire » (cf. encart).

Le S/PDIF a été initialement conçu dans une résolution de 16 bits pour des fréquences d'échantillonnage de 32 kHz pour le DSR (Digital Satellite Receiver), 44,1 kHz pour le CD (Compact Disc) et 48 kHz pour le DAT (Digital Audio Tape). Les révisions successives portèrent la résolution du S/PDIF à 20 puis 24 bits. La fréquence n'a pas été en reste car certains matériels acceptent maintenant une fréquence de 96 kHz : applications professionnelles et semi-professionnelles : échantillonneurs (samplers), synthétiseurs, workstations, interfaces et enregistreurs audionumériques…

TOSLINK

Ce connecteur optique a été créé en 1983 par Toshiba pour les liaisons de ses lecteurs CD à ses amplificateurs audio haut de gamme. Son nom vient de TOShiba-LINK (LINK = lien). Le connecteur est défini « F05 JIS », et l'interface dépend de la norme « EIAJ CP340-optical ». Cette connectique fut rapidement adoptée par les autres constructeurs de lecteurs CD et enregistreur DAT, ainsi que Alesis pour ses enregistreurs ADAT. Les connecteurs TOSLINK les plus utilisés sont, et de loin, le « EIAJ/JEITA RC-5720 », le « CP-1201 » et le « JIS C5974-1993 F05 ».

Câble CableOptiqueTOSLINK Il y a aussi une version S/PDIF avec interface optique et fibres optiques. Le signal optique a le même format (protocole) que la liaison électrique « cuivre » sur RCA. Il est juste convertit en lumière émise par une diode LED rouge (jour, nuit...). Les connecteurs optiques utilisés sont connus sous le nom de TOSlink (cf. encart). Le principal avantage de ce format réside dans son immunité totale face aux perturbations électromagnétiques. La longueur maximum sans perte dépend en grande partie de la qualité intrinsèque de la fibre. Il est conseillé de ne pas dépasser 10 mètres sous peine de voir apparaître le JITTER (lire ci-après).

IEC958 a été nommé IEC60958 en 1998. IEC60958 (S/PDIF) transporte de l'audio stéréo normal et IEC61937 celui d'un flux de données plus complexe. Les données sous la norme IEC-61937 peuvent contenir un son multi-canal comme le MPEG2, AC3 ou DTS. Quand des données sont transférées en IEC61937, les bits qui transportent normalement les échantillons audio sont remplacés par des données multi-canal dans le signal S/PDIF. L'information sur le statut de canal contient un bit qui indique si les données S/PDIF sont de l'audio numérique ou d'autres données (DTS, AC3, MPEG audio, etc.). En fonction de ce bit, l'équipement audio numérique traite les données différemment. L'audio en multi-canal est compressé. C'est pour cela qu'on ne parle plus d'audio mais de données. Ce mode est utilisé pour connecter la sortie d'un lecteur DVD à un système audio home-cinéma qui prend en charge le son encodé en Dolby Digital, en AC3 ou en DTS Surround.

Attention : Ne pas confondre S/PDIF avec SDIF (pas de « P »). Ils sont très différents. Le format SDIF a été développé et utilisé exclusivement par Sony sur les premières machines numériques professionnelles. Ce format est mono et non auto-synchronisés, nécessitant par conséquent trois câbles d'interconnexion : un pour chaque canal du signal stéréo et un pour l'horloge de synchronisation.

ADAT

Câble Cable Optique TOSLINKL'interface ADAT, dite aussi « Lightpipe », a été conçue par Alesis en 1991 pour ses enregistreurs numériques 8 canaux. Le nom ADAT est l'acronyme de « Alesis Digital Audio Tape ». Cette interface utilise le connecteur physique TOSLINK fibre optique (cf. encart). Mais son format de données numérique est complètement différent de celui employé en S/PDIF. Il a été conçu pour transporter jusqu'à huit canaux audio à des fréquences d'échantillonnage de 44,1 kHz ou 48 kHz, initialement dans une résolution de 16 bits. Les révisions successives portèrent celle-ci à 20 puis 24 bits. Très vite, le format ADAT s'est popularisé, et il est devenu une interface de connexion très prisée pour les équipements semi-professionnels.

Autres formats professionnels et assimilés

SMUX (ou S/MUX)

Câble CableOptiqueTOSLINK Pour tenir compte de fréquences d'échantillonnage plus élevées, le format original ADAT Lightpipe a été modifié par la société Sonorus en utilisant des techniques de multiplexage. S/MUX est l'abréviation de « Sample MUltipleXing ». Vous pouvez avoir normalement huit canaux à 48 kHz. Puis vous en avez quatre à 96 kHz, et deux canaux à 192 kHz. De nombreux fabricants intégrant l'interface ADAT à leurs produits font prendre en charge l'interface SMUX. Couramment, le SMUX accepte des fréquences d'échantillonnage atteignant 96 kHz et utilise deux fibres optiques respectivement pour les canaux 1 à 4 et 5 à 8. Pour synchroniser une interface audio via SMUX (double fibre optique) sur un autre appareil comme une console de mixage numérique, vous devez utiliser deux câbles optiques (de préférence de même longueur et de même marque) entre l'appareil source de l'horloge SMUX et les deux entrées optiques de votre interface audio numérique. Depuis la face avant, sélectionnez ADAT comme source d'horloge externe. L'interface se synchronisera sur le Word Clock contenu dans le signal numérique arrivant à ses entrées optiques. Dans les rares cas où les canaux SMUX 1—4 et 5—8 viennent d'appareils différents, il est important de s'assurer que les trois appareils ont une bonne synchronisation Word Clock (voir ci-après). Dans ce cas on utilisera une horloge externe « Clock Master » que l'on branchera via des câbles 75 ohms à connecteurs BNC sur tous les appareils sur lesquels on choisira « External Clock », « DIG EXT » ou quelque chose de ce genre.

MADI

Câble 75 ohms BNC La dernière déclinaison de l'AES3 est le MADI (Multi-channel Audio Digital Interface). Elle vise à fournir une connexion simple entre une console de mixage numérique et un enregistreur multi-canal. En 1991, lorsque cette interface a été publiée en tant que AES10, elle a été conçue pour transmettre 56 canaux audio (configurés en 28 paires AES3) sur un seul câble coaxial équipé de connecteurs BNC. Toutefois, une version améliorée a été introduite en 2003 appelée Extended MADI ou MADI-X, et elle prévoit des 64 canaux à 48 kHz et 32 à 96 kHz. Plusieurs type de connexions sont possibles : fibre optique ou câble catégorie 5 (Cat5) : câbles à quatre paires torsadées. Beaucoup d'installations sont réalisées avec de la fibre optique ou câble Cat 5 au lieu du câble coaxial. L'interface fibre est particulièrement utile dans les lieux où l'isolement électrique complet évite les boucles de masse et les éventuels problèmes de sécurité électrique. MADI est de plus en plus courant pour les connexions entre une station de montage audio numérique sur ordinateur (DAW : Digital Audio Workstation) et console, ou pour relier plusieurs appareils situés dans une salle des machines avec la salle de contrôle (control room) en utilisant un seul câble ou fibre optique. Plusieurs fabricants offrent maintenant des interfaces MADI. Une différence significative entre le MADI et les autres interfaces AES3 est qu'elle ne dispose pas d'une horloge intégrée dans un code de service. Un signal d'horloge séparée est indispensable pour synchroniser la source et la destination des appareils utilisant MADI. On utilisera alors un générateur Word Clock (voir plus loin).

AES50, l'audio par Ethernet  

Ethernet

Ethernet est un protocole de réseau informatique local. Ethernet est une technologie universelle qui dominait déjà les réseaux informatiques locaux bien avant le développement de l'Internet. Ethernet a originellement été développé par Robert Metcalfe dans l'un des projets pionniers du Xerox PARC dans les années 70. La simplicité de la méthode d'accès et la simplicité de l'interconnexion avec les autres technologies ont fait d'Ethernet une technologie évolutive à des coûts acceptables pour toutes les catégories d'utilisateurs. Même si les évolutions des débits ont entraîné l'abandon de supports bon marché (câbles coaxiaux lors du passage de 10 à 100Mbps), la mise en oeuvre est restée simple. Les infrastructures existantes progressent vers les technologies multimédias sans réinvestissements lourds.

Depuis les années 1990, on utilise très fréquemment Ethernet sur paires torsadées pour la connexion des postes clients, et des versions sur fibre optique pour le cœur du réseau ou des longues distances.

Neutrik RJ45 L'AES50 est destiné à l'équipement scénique et autres manifestations publiques. Il est conçu pour remplacer les encombrants câbles multipaire. Cette norme de transmission audionumérique est née en 2005.

L'AES50 définie un protocole de transmission s’appuyant sur le standard audionumérique AES3 (AES/EBU) et le transport d'informations numériques sur Ethernet utilisé en informatique. En ingénierie audio et ingénierie de radio-diffusion, "Audio over Ethernet" (appelé aussi "AoE") est l'utilisation d'un réseau Ethernet pour distribuer l'audionumérique en temps réel. Il est conçu pour remplacer les câbles multipaire (analogique) par une liaison multicanal multiplexée avec le signal d’horloge transmis en sous-code dans le flux de données audio. En apparence, AoE ressemble à la voix sur IP (VoIP). L'AoE nécessite un réseau Ethernet haute performance. Pour cela, on peut avoir recours à un réseau local dédié (LAN) ou créer un réseau local virtuel (VLAN) sur le LAN existant. Cette norme permet de véhiculer 48 canaux audio à 44,1 ou 48 kHz ou 24 canaux à 88,2 ou 96 kHz. Le câble utilisé contenant 4 paires torsadées est identique à celui utilisé pour les liaisons informatiques 100 MHz à des débits ne dépassant pas 100 Mbits/s : le câble Catégorie 5 (souvent noté “Cat.5”). Il est recommandé d’utiliser un câble Cat5 de type STP (blindé par paire). La longueur maximum est de 100 mètres. Cette distance peut atteindre 500 mètres en utilisant de la fibre optique 50/125 µm multimode. L'AoE permet d’avoir en plus une liaison réseau standard Ethernet à 5 Mbit/s en full duplex. Des constructeurs de consoles de mixage et autres équipements audio ont intégré cette interface AES50 dans certains de leurs produits : Behringer, Klark Teknik, Lynx Studio Technology, Midas, Soundcraft, SSL, Studer; pour ne citer qu'eux (liste non exhaustive).

Toron RJ45 L'AES50 est un standard ouvert de l'Audio Engineering Society (www.aes.org) basé sur le protocole SuperMAC et HyperMAC initialement développé par Sony Lab Pro-Audio à Oxford et maintenant détenu par Klark Teknik. Il convient de noter que SuperMAC diffère de la norme AES50 par un temps de latence différent à des fréquences d'échantillonnages supérieures à 96 kHz et que le format Direct-Stream Digital (DSD) n'est pas prit en charge.

HyperMAC, une technologie Klark Teknik dérivée du SuperMAC, offre 192 canaux audio à 96 kHz sur un câble Cat5e/Cat6 ou fibre optique 50/125 µm multimode (384 canaux bidirectionnels à 48 kHz) avec une très faible latence. Le canal de données auxiliaires passe à 200 Mbit/s.

Le MIDI  

Pourquoi 31.250 bauds ?

31.250 est le résultat de la division de 500.000 par 16 ou 1.000.000 par 32. Au début des années 1980, 500 kHz ou 1 MHz étaient des fréquences d'horloge couramment utilisées dans les ordinateurs.

Trio MIDI Les liaisons MIDI sont aussi des connexions numériques. Même si on étiquette pas le MIDI comme un protocole numérique, il s'agit bien d'une liaison digitale. C'est une liaison série à 31.250 bits par seconde, soit approximativement 3,8 Ko/s. C'est une transmission asynchrone. 16 canaux MIDI sont multiplexés sur une paire de fil. Les signaux vont de l'émetteur vers le récepteur. Il est unidirectionnel. Un deuxième câble permet le retour d'informations, et assure ainsi le dialogue "Handshake".

DIN 5 broches Le câble ressemble à un câble audio symétrique — avec blindage — qui transporte un signal à +5 volts (TTL). Pour éviter les parasites électriques et plus particulièrement les boucles de masse, le signal entrant en MIDI IN passe par un coupleur opto-électronique. Cette isolation galvanique permet de fiabiliser les transmissions en les rendant insensibles aux différences de potentiels qui peuvent apparaître entre les masses des différents appareils MIDI connectés. Le connecteur MIDI est une prise DIN 5 broches à 180° — mâle et femelle — dont on utilise que les broches 4 et 5. La broche 2 est connectée à la masse sur les connecteurs OUT et THRU, mais ne l'est pas sur la IN. Attention, le MIDI ce n'est pas de l'audio, c'est uniquement un protocole/language de communication/commande, mais c'est bien une liaison numérique.


Dialogue entre les différentes normes possible ?

Il existe des interfaces numériques chargées de changer le format numérique. Ces interfaces sont aussi capables de changer la fréquence et la résolution. Ainsi, il est possible de faire dialoguer un appareil ayant une sortie S/PDIF en 44,1 kHz et 24 bits vers une paire de canaux ADAT en 48 kHz en 24 bits, et réciproquement. Ou bien une sortie AES/EBU en 96 kHz et 24 bits vers une entrée S/PDIF en 44,1 kHz et 16 bits (et réciproquement). Ou alors deux canaux ADAT en 48 kHz vers une entrée AES/EBU en 96 kHz sans changement de résolution. Dans le cas d'une réduction de résolution, il faut appliquer un "Dither". Le Dither est un circuit électronique qui ajoute un faible bruit blanc au signal audio avant de le requantifier. Cela permet de limiter à un niveau inaudible les distorsions engendrées par la troncature des bits de poids faibles des signaux audio de faibles amplitudes.

Quelques convertisseurs :
AES3-S/PDIF : Behringer SRC2496, AES3-S/PDIF-ADAT : Alesis AI-1, AES3-S/PDIF-ADAT-SMUX2-SMUX4 : Mutec MC-4

Le brassage en audio-numérique

Les patchbays en numérique (digital patchbay)

Patchbay XLRPour l'audio numérique, il existe des baies de brassage pour le S/PDIF, l'AES/EBU (AES3) et l'ADAT™. Les platines et cordons de brassage ont des connecteurs différents : XLR (connecteur Cannon), RCA (connecteur phono), TOSlink™ (fibre optique) ou BNC (connecteur à baïonnette). Les patch bays équipés de BNC sont généralement destinés au routage vidéo. Des platines de brassage équipées de connexion XLR permettent de faire un routage physique et visualisable pour le format numérique AES/EBU. Les baies équipées d'électronique effectuent un routage sans cordon patch. Les liaisons sont faites par des circuits internes, bien souvent programmables et mémorisables. Ces baies ont du matériel actif, contrairement au brassage audio analogique qui est totalement passif. En effet, les signaux numériques ont quelques contraintes : remise en forme des fronts montants (trigger), élévation du signal à un niveau électrique normé, voire conversion pour un changement de format (protocole) numérique. Dans les liaisons "cuivre", l'impédance du câble devra respecter la norme audionumérique utilisée : 110 ohms pour l'AES3 et 75 ohms pour le S/PDIF ou l'AES3id.

Quelques patchbays numériques :

Frontier Design ApacheLe Frontier Design Apache est un patchbay numérique optique à 12 ports qui permet d'envoyer et de recevoir des signaux dans les deux ADAT (8 canaux) ou S/PDIF (2 canaux) en TOSlink. Chacune des 12 entrées optiques peuvent être orientée indépendamment à une ou plusieurs de ses 12 sorties optiques, de sorte que vous pouvez assigner un signal d'un appareil à un autre, ou de distribuer un signal à plusieurs périphériques.

M-Audio DigiPatch 12x6Le M-Audio (Midiman) DigiPatch 12x6 est un patchbay audio numérique pour signal S/PDIF et ADAT. Il a 12 entrées totalement indépendantes appelées sources, et 6 paires de sorties appelées cibles (target). Les connexions sont établies dans le sens source vers destination cible. En d'autres termes, vous devez d'abord choisir la cible à atteindre, puis choisissez la source pour cette cible. Une fois que vous avez sélectionné les sources pour les objectifs souhaités, vous pouvez enregistrer cette configuration dans un programme pour le rappeler ultérieurement. Le DigiPatch est une matrice de commutation simple. Il achemine les niveaux numériques (les zéros et les uns) d'un connecteur à un autre. Il peut être utilisé pour convertir le signal optique en électrique (coaxial), et réciproquement. Le DigiPatch ne décode et rencode pas les signaux audio numériques. En particulier, il ne sait pas faire la différence entre un signal S/PDIF et un signal ADAT. Il ne fait que lier les entrées aux sorties.

tc.electronic Digital Konnekt X32Le TC Electronic Digital Konnekt x32 est — selon elle — le chaînon manquant de chaque studio intégrant des équipements numériques avec des configurations d'enregistrement sur ordinateur. Digital Konnekt x32 est le produit utile correspondant aux besoins des project-studios et autres configurations numériques qui ont besoin d'un « couteau suisse » dans la gestion des signaux numériques. Il dispose d'une interface 32 canaux audio (8x AES/SPDIF IO/6x TOS IN, 4x TOS OUT, 8x ADAT (up to 96 kHz SMUX), synchro Word Clock), d'une connexion FireWire™ (16 canaux) vers et depuis votre DAW et elle permet un routage efficace et conversion entre plusieurs formats numériques et fréquences d'échantillonnage, ainsi que de proposer des fonctionnalités supplémentaires telles que des sorties analogiques, mémorisation de configurations et rappel de scène.

D'autres marques font aussi des appareils de routage audio-numériques…

Longueurs des câbles numériques

Très souvent recherchées et trop souvent erronées dans les nombreux forums dans lesquels le sujet est abordé, les longueurs maximales des câbles pour le transport des données numériques sont un sujet récurrent. J'ai donc ajouté ici un tableau qui récapitule par norme, la longueur maximale préconisée.

Interfaces numériques
NormeType de liaisonConnecteurNbre de canauxImpédance
(ohms)
Longueur
maximum
conseillée
(mètres)
Remarques
AES/EBU
(AES3)
symétriqueXLR2110100Audio et signal d'horloge dans le même câble
AES3-id asymétriqueBNC1751000Peut utiliser les câbles vidéo en 75Ω équipés de BNC
S/PDIF asymétrique Cuivre: CINCH27510Version grand public de l'AES/EBU avec une tension crête à crête plus faible.
Peut poser des problèmes au delà de 5 mètres, liés à la qualité du câble ou de la fibre.
Optique: TOSLINK210
ADAT optiqueTOSLINK810Format multicanal développé par ALESIS
SMUX optiqueTOSLINK45Version de l'ADAT pour des fréquences supérieures à 48 kHz comprises entre 88,2 et 96 kHz, développée par SONORUS. Prendre deux fibres de même marque et même longueur.
MADI
(AES10)
optiqueSC 642000Utilise la fibre optique (FO) ou un câble cuivre (Cu) coaxial 75 Ω ou un câble Cat.5 (paires torsadées)
asymétriqueBNC75100
symétriqueRJ45100100
AoE
(AES50)
optiqueSC48 @48kHz
24 @96kHz
500Utilise la fibre optique (FO) ou un câble Cat.5 (paires torsadées)
symétriqueRJ45100100
Word Clock asymétriqueBNC7530Signal de synchro transporté séparément
Interface MIDI
MIDI symétriqueDIN
5 broches à 180°
1615Liaison série unidirectionnelle
Interfaces propriétaires
R-BUS symétrique?D-SUB 25 broches8??Format propriétaire ROLAND
T-DIF symétriqueD-SUB 25 broches8??Format propriétaire TASCAM
Interfaces obsolètes
SDIF-2 asymétriqueBNC27530Format DASH (magnéto à bande) de SONY a ét&eacut; adopté par STUDER et SSL
SDIF-2 symétriqueD-SUB 50 broches2430Format DASH (magnéto à bande) de SONY a ét&eacut; adopté par STUDER et SSL
Mitsubishi symétriqueD-SUB 50 broches16?Format ProDigi (magnéto à bande) utilisé aussi par OTARI
Source : www.aes.org (11/2013), www.wikiaudio.org (11/2013), www.wikipedia.org (11/2013), www.rme-audio.de (11/2013), www.presonus.com (11/2013), magazine Home-Studio-Recording HS N°2 (1994)
Section mise à jour le 25/02/2016.

Attention : le problème des longueurs des câbles est bien plus complexe qu'on ne l'imagine car rentre en ligne de compte la nature du matériau conducteur, la résistivité de celui-ci, la nature et le diélectrique de l'isolant, le coefficient de recouvrement du blindage (tresse, feuillard, paire écrantée, etc.), l'impédance, effets capacitif et inductif, fréquences du flux numérique (Data Rates), et j'en passe… Pour avoir une information formelle, il est préférable de consulter les données des câbliers et autres équipementiers (Belden, Canare, FastLine, Hosa, Mogami, entre autres).

La synchronisation numérique

WORD CLOCK (ou wordclock), la synchronisation externe

Synchronisation A l'exception déjà mentionnée de l'interface MADI, les interfaces AES3, S/PDIF et ADAT « Lightpipe » sont auto-synchronisés. Le signal d'horloge est intégré au flux audio («  embedded » : encapsulé). Ainsi, dans un système simple, un appareil numérique récepteur se synchronise spontanément sur le signal d'horloge reçu sur son entrée car il est généré par un appareil source, et mélangé au flux de données audio. Dans de nombreux cas cela se produit de manière entièrement automatique et transparente. Un enregistreur/graveur de CD se synchronise forcément sur son entrée numérique lors de l'enregistrement/gravure, par exemple.

Wordclock 1

Il est plus facile à une machine numérique de fonctionner de manière autonome que synchronisé à l'échantillon près avec plusieurs autres. Par analogie, un musicien seul suivra son propre rythme, alors que plusieurs doivent forcément se caler sur le bon tempo pour que la musique soit cohérente. C'est le rôle du batteur lorsqu'il y a plusieurs musiciens. Un générateur Word Clock rempli cette mission de batteur pour assurer un rythme constant. La fréquence Wordclock correspond toujours à la fréquence d'échantillonnage sélectionnée. Ce générateur est aussi appelé aussi « Clock Master ». Il ne s'agit pas ici de la synchronisation MIDI ou SMPTE mais de la synchronisation de tous les circuits de traitement audio numérique. La fonction de synchronisation numérique ne fonctionne que lorsque la chaîne de signal Wordclock est correctement établie (et terminée). Lorsque tous les appareils d'un système se servent de la même source de synchronisation, ils doivent tous être mis sous tension, même si vous ne les utilisez pas. Commencez toujours par mettre l'appareil maître sous tension puis les appareils asservis (esclaves). Lors de mise hors tension, inversez l'ordre: les éléments asservis d'abord, puis l'appareil maître. Avant une session d'enregistrement importante, assurez-vous que tous les appareils sont bien synchronisés sur l'appareil maître. En général, les appareils numériques sont pourvus d'un témoin ou d'un affichage qui indique s'ils sont pilotés par une source interne ou externe. Selon votre interface ou appareil audio numérique, les options de source d'horloge externe peuvent inclure AES/EBU, S/PDIF, S/PDIF Optical, ADAT Optical, TDIF et Word Clock.

L'importance de la synchronisation numérique

Il est évident que la principale différence entre le haut de gamme et les convertisseurs premier prix est la qualité, la stabilité et la cohérence des circuits d'horloge interne — la partie qui détermine le moment où un échantillon est prélevé. Si cette horloge de référence n'est pas particulièrement stable alors l'intervalle entre les échantillons — qui devrait être absolument précis — peut varier. Ce problème est connu sous le nom de « JITTER » (prononcez « jiteur »), et il affecte différents aspects des systèmes audio numériques. Il impacte surtout la conversion analogique vers numérique (« A/N », en anglais « A/D »), et, dans une moindre mesure, la conversion numérique vers analogique (« N/A », en anglais « D/A »).

Lorsque le signal audio analogique est converti en signal audio numérique, celui-ci est échantillonné à intervalles réguliers et ces échantillons sont convertis en données (signal) numériques. Plus la fréquence est élevée, plus la conversion est précise. Afin d'atteindre un très haut degré de précision dans le traitement des signaux audio numériques par plusieurs appareils, ces échantillons doivent être synchronisés. Le signal transmis pour réaliser cette synchronisation est appelé « Wordclock » ou horloge. Le signal d'horloge est transmis par un câble différent que celui qui véhicule l'audio. Le signal Wordclock est généralement diffusé en réseau, en chaîne ou en étoile. Il est transporté par un câble coaxial 75 ohms et les connecteurs sont du type BNC. Ces connecteurs sont étiquetés WORD CLOCK. Tous les appareils d'un réseau sont synchronisés sur une même horloge « Clock Master ». Ce système est utilisé pour synchroniser deux appareils ou plus. Si la synchronisation n'est pas établie, un message « UNLOCK », « LOCK ERROR », « SYNC ERROR », « PLL ERROR » ou « WD ERROR » est signalé (par un voyant LED ou un afficheur LCD), ou quelque chose de ce genre.

Wordclock 2

La création d'un signal de synchronisation s'appuie sur la fréquence d'un oscillateur à quartz pour sa grande stabilité. Malgré les contrôles qualité effectués sur les chaînes de productions mettant à l'écart certains produits ; aucun oscillateur n'est identique. De plus la fréquence de fonctionnement des oscillateurs dépend de facteurs électriques (température). S'il y a des fluctuations du signal Word Clock de l'appareil de référence cela n'a que peu d'importance car les appareils asservis suivront ces variations de la fréquence de l'horloge. Sauf si le phénomène de Jitter s'en mêle…

Connexions et terminateur Word Clock

Câble 75 ohms BNC Le Wordclock est un signal carré TTL; c'est pourquoi les entrées et sorties sont des bornes BNC. Le signal d'horloge est transporté dans un câble coaxial de 75 ohms normé portant le nom de RG59. La qualité du câble est importante pour minimiser les pertes. Dans la pratique, on essaie d'avoir des câbles aussi courts que possible, en particulier lorsque l'on travaille avec des fréquences d'horloge élevées (192 kHz). Sur Internet et les forums, on trouve de tout sur les recommandations de longueur à ne pas dépasser. Cela va de 3 à 300 mètres; autant dire que la marge est grande. La longueur maximum de 30 mètres étant citée plusieurs fois, je me base donc sur celle-ci. C'est déjà long. Il faut aussi privilégier une configuration en étoile au lieu du chaînage d'un appareil à l'autre. Si votre installation est complexe, un distributeur d'horloge WC s'impose. La fonction de synchronisation numérique ne fonctionne que lorsque la chaîne de signal Wordclock est correctement établie et terminée. Si la terminaison n'est pas effectuée correctement, il peut y avoir disruption de la forme d'onde du signal d'horloge, ce qui risque de générer de la distorsion et du bruit, d'où des pertes de synchronisations aléatoires. La terminaison est bien souvent sous la forme d'une résistance de 75 ohms incorporée dans un simple connecteur BNC. Connecteur BNC en Té On verrouille ce terminateur — appelé aussi « bouchon » — sur la branche du Té BNC opposée à celle où est branchée le coaxial de 75 Ω par lequel arrive le signal d'horloge. La « jambe » du Té est branchée sur l'appareil à synchroniser. La console Yamaha 03D, le préamplificateur Presonus Digimax FS, le mixeur Roland M-1000 ou l'interface RME Fireface 800, par exemple, sont pourvus d'un terminateur 75Ω interne, commutable en face arrière sur la borne WORDCLOCK INPUT. Vous trouverez ci-dessous trois exemples de connexions. Notez aussi le réglage du terminateur 75Ω Wordclock.

1. Répartition parallèle avec une interface IFU4

Wordclock - Branchement 1

Dans cet exemple, une interface IFU4 de Yamaha sert à répartir le signal Wordclock. C'est pourquoi tous les appareils asservis doivent être terminés.

Terminateur 75 ohms BNCPour le dernier appareil en bout de chaîne Wordclock, il faut utiliser la terminaison (interrupteur « 75Ω » sur la position « ON »). La résistance du terminateur est de 75Ω, la même que celle du câble Wordclock, et arrête les signaux. Pour certains appareils se trouvant en bout de chaîne et ne disposant pas de la résistance de 75Ω interne, comme le Behringer SRC2496, il est impératif d'arrêter le signal par un terminateur 75Ω monté sur la branche libre du Té BNC. Au fur et à mesure que la fréquence d'un signal word clock augmente, les impératifs de terminaison deviennent de plus en plus cruciaux pour une transmission précise des données. Pour garantir l'intégrité d'une onde d'horloge, chaque connexion doit être terminée par une charge de 75 ohms d'impédance. Une sur-terminaison (une charge d'impédance inférieure à 75 ohms) atténuera le signal de manière excessive, alors qu'une sous-terminaison (une charge d'impédance supérieure à 75 ohms) introduit une saturation et autres distorsions du signal.

Wordclock - Branchement 1 bis

Il existe des horloges maîtres (Clock Master) qui possèdent plusieurs sorties comme le SYNCGEN de ART.

2. Avec des connecteurs BNC T-bar

Wordclock - Branchement 2

Ce système ressemble au précédent mais la répartition se fait ici avec des connecteurs en T. C'est pourquoi seul le dernier appareil doit être terminé. Ici on considère que l'appareil D n'a pas de résistance de terminaison interne ; c'est pourquoi un « bouchon » est

3. Connexion en chaîne

Wordclock - Branchement 3

Dans cet exemple, l'appareil maître est un enregistreur multipiste numérique. Les terminateurs des deux appareils sont sur ON. Toutefois, ce type de répartition Wordclock n'est pas idéal pour les grands systèmes car un retard se crée dans la retransmission, mais la dégradation du signal envoyé aux appareils en aval est moindre.

Wordclock - Branchement 4

Sur certains appareils il existe un interrupteur « THRU », à l'instar des connexions MIDI. Dans ce cas il devra être sur ON pour l'appareil A sur lequel 75 Ω sera sur OFF. Le signal d'horloge est retransmis. Les appareils A, B sont synchronisés avec un timing exact.

Signal d'horloge sur XLR

La norme AES11 définit le moyen pour transporter un signal d'horloge de synchronisation sur une connexion XLR (protocole et signal identique à l'AES3) ou RCA (phono). Cette connexion est aussi appelée DARS (Digital Audio Reference Signal).

La dérive du signal d'horloge

JITTER

Dans la conversion de signaux analogiques et leurs traitements numériques, la fréquence d'échantillonnage est généralement supposée être constante. Dans le domaine des transmissions numériques et plus particulièrement des liaisons série, les échantillons doivent être convertis à intervalles réguliers et constant. Le Jitter (en français « Gigue ») est le phénomène de fluctuation d'un signal. Cette fluctuation peut être un glissement de phase et/ou une dispersion temporelle liée à la déformation des fronts montants et descendant du signal numérique. Elle entraîne des erreurs en sortie lors de la récupération des données.

Jitter

Le Jitter semble ne pouvoir être évité. Les constructeurs minimisent son effet en employant des circuits électronique complexes tâchant de neutraliser la déformation et fluctuation du signal numérique d'horloge. Certains analystes ont trouvé une corrélation entre le Jitteur et la performance musicale des processeurs numérique et son influence sur la restitution musicale…

Quelle fréquence et quelle résolution adopter pour votre projet ?

Les interfaces audionumériques actuelles proposent une large plage de fréquence d’échantillonnage (44.1, 48, 88.2, 96, 176.4 et 192 kHz) et généralement deux résolutions (16 ou 24 bits) pour s'adapter à deux types de projets. Il est important que vous choisissiez une fréquence d’échantillonnage et une résolution pour votre session avant de commencer à enregistrer. Ce choix est crucial car il évitera par la suite de perdre du temps en conversions numériques, mais aussi de dégrader la qualité de vos enregistrements. Pour vous guider dans le choix à prendre, voici deux règles d'usage commun :

Projet musical :

Votre mixage final sera lu sur une platine CD, un lecteur MP3 ou AAC ou tout autre appareil audio, il est recommandé de travailler en 24 bits à une fréquence multiple de 44,1 kHz (44,1, 88,2 ou 176,4 kHz).
Rien ne vous interdit d'enregistrer en 16 bits à 44,1 kHz si vous choisissez de graver vous-même vos œuvres directement sur un CD audio.

Projet vidéo :

Votre mixage final sera la bande son d'une vidéo lue sur une platine DVD, diffusé à la télévision ou tout autre appareil vidéo, il est recommandé de travailler en 24 bits à une fréquence multiple de 48 kHz (48, 96 ou 192 kHz).

/!\ Ce ne sont que des recommandations… ;-)

Voir pourquoi il ne faut pas taper dans le rouge…

Jamais zéro dB !

• Le « Headroom » c'est la marge de sécurité entre les crêtes les plus fortes d’une piste et le 0 dBFS (zero dB Full Scale : zéro dB à pleine échelle). Une habitude héritée de l'enregistrement analogique et qui perdure en numérique consiste à régler le gain de chaque piste afin qu'il frise avec le 0 dB. En numérique cette façon de faire est soumise à d'autre règle car le niveau du bruit de fond que l'on cherchait à combattre en analogique est beaucoup plus bas en numérique 24 bits. Avec une prise de son en 24 bits vous pouvez enregistrer vos pistes avec des crêtes entre -10 et -8 dB. En enregistrant vos pistes avec un niveau moyen autour de -20 dB, vous aurez ensuite assez de réserve de niveau, de headroom, pour effectuer un mixage dans de bonnes conditions.

• En sortie Master, on module au maximum (niveau de crête) entre -6 et -3 dB pour conserver un rapport signal sur bruit raisonnable et se préserver de tout écrêtage durant le pré-mastering ou la conversion en analogique. Sinon, il sera impossible d'ajouter la moindre EQ sans risque de saturation.
▶ Au delà, il y a un risque de clippage et donc de saturation numérique.
Le niveau de 0,2 ou 0,1 dBFS sera laissé à la charge du studio de pré-mastering, avec les outils adéquats.

Il est donc important de travailler au bon niveau, sachant que les convertisseurs des cartes son encodent et décodent en 24 bits pour la grande majorité. Cela est indépendant de la résolution interne du logiciel audionumérique, même si celui-ci est en 32 bits (32 bits pour le calcul).

Le format de fichier 32 bits à virgule flottante (32 bit float) permet d'exploiter une résolution audio supérieure en enregistrement ou pour l'importation, avec une marge de sécurité plus confortable pour préserver l'intégrité de l'audio de bout en bout. La résolution en 32 bits est en fait de 24 bits. Les 8 bits supplémentaires servent à stocker la position de la virgule flottante. Les erreurs d'arrondis sont minimisées lors du traitement, du calcul sur le signal. Cela préserve l'intégrité de la forme d'onde tout au long des calculs.

Exportez le mix stéréo final en 24 bits afin d'avoir une plus grande dynamique qu'en 16 bits. Les traitements de pré-mastering seront plus efficaces, et la conversion de 24 à 16 bits ne se fera qu'en dernière étape.

Bon câblage… souriant


Les indications de marques et modèles qui figurent dans cette page sont données à titre d'information sans aucun but publicitaire. Les marques déposées sont la propriété de leurs propriétaires respectifs.


Présenté par Jenfi Home.
Copyright © 2001-2017 Jean-Philippe Mamosa.
Toutes les photographies, sons, programmes, marques déposées et les logos sont propriétés de leurs détenteurs respectifs.
Page modifiée il y a 5 mois, un vendredi à 22h01mn.