Nicolas Titeux

Ingénieur du son | Sound designer
Compositeur

Tout savoir sur le pitch shifting

par | Fév 28, 2022

En sound design, l’un des procédés les plus employés consiste à modifier la hauteur d’un son, généralement en changeant sa vitesse de lecture. On appelle cet effet pitch shifting  (variation de hauteur en français). Cette manipulation assez simple a des conséquences importantes sur le timbre du son. Voyons cela en détail.

waveform pitch shift

Qu’est-ce que la hauteur d’un son ?

 

La hauteur est une caractéristique fondamentale d’un son qui correspond à la fréquence à laquelle l’air vibre. On exprime la fréquence en Hertz, 1 Hz équivaut à une oscillation par seconde. L’oreille humaine peut entendre des fréquences comprises entre 20 et 20 000 Hz environ. Les fréquences comprises entre 20 Hz et 200 Hz sont appelées graves, de 200 Hz à 2000 Hz médium, et de 2000 Hz à 20 000 Hz aigus. Note : Ces valeurs, faciles à mémoriser, sont approximatives et il n’y a pas de réel consensus là-dessus.

plage de fréquences du son

Qu’est-ce que le pitch shifting ?

 

Le pitch shifting (changement de hauteur en anglais) consiste à modifier la hauteur d’un son. La manière la plus simple d’y parvenir est d’accélérer ou ralentir le son qu’on veut modifier, on parle alors de resampling (ré-échantillonnage). Quand on accélère un son, on augmente sa fréquence et on réduit sa durée : le son devient plus aigu. Inversement, si on ralentit un son, on baisse sa fréquence et on augmente sa durée : le son devient plus grave.

minions pitch shift

Vous avez certainement entendu des dizaines d’exemples de pitch shifting au cinéma ou à la radio. L’effet est souvent employé pour donner une voix amusante à des personnages : les souris de Cendrillon, des Minions, les Lapins Crétins, ou les 2 minutes du peuple.

Mais pourquoi les voix « pitchées » (dont on a modifié la hauteur) paraissent-elles artificielles ? Nous sommes pourtant bien capables de moduler la hauteur de notre voix. La raison se trouve dans une notion essentiellement connue des acousticiens : les formants du son.

Que sont les formants du son ?

 

De manière simplifiée, les formants sont une sorte d’empreinte acoustique unique d’une voix ou d’un instrument. Ce sont des zones fréquentielles qui contiennent toujours plus d’énergie que les autres. Les formants sont liés à la physionomie d’une personne ou d’un instrument et ne varient pas en fonction de la hauteur.

Ci-dessous le spectrogramme d’une phrase chantée. Les zones les plus claires matérialisent les formants et les différentes lignes matérialisent les harmoniques du son. Les formants agissent comme des filtres à l’intérieur desquels les harmoniques sont amplifiés.

Formants voix

Le pitch shifting modifie les formants acoustiques

 

Lorsqu’on modifie artificiellement la hauteur d’un son, on transpose l’ensemble de ses composants : la note fondamentale, les harmoniques, mais aussi les formants. Or pour que le timbre d’un son soit reconnaissable, il faut que les formants soient inchangés.

Dans l’exemple qui suit, on entend successivement une note chantée, puis la même note chantée à l’octave, suivie d’une note artificiellement montée d’une octave.

Le spectrogramme suivant correspond aux trois sons précédents. On constate bien que les deux premières notes, bien que séparées d’une octave, ont les mêmes formants (zones claires). Les formants de la troisième note pitchée sont tous décalés, c’est pourquoi le timbre du son parait artificiel.

Pitch shift formant 3 notes arrows

Voici un deuxième exemple, avec un portamento (une note qui glisse jusqu’à une autre note) réalisé vocalement, puis avec un outil de pitch shifting. Ecoutez comme le son devient rapidement artificiel dans le deuxième cas.

A gauche, on remarque que les fréquences se déplacent vers le haut mais les formants sont fixes, c’est la signature d’un son acoustique naturel. Sur le spectrogramme de droite en revanche, les formants suivent la variation de hauteur, ce qui rend le son complètement synthétique. Visuellement, on devine d’ailleurs quel son est naturel.

Sound formant portamento

Histoire du pitch shifting

 

1 Les débuts du cinéma : les supports analogiques

 

Les amateurs de disque vinyle le savent, il suffit de changer la vitesse de lecture d’une platine pour changer la hauteur du morceau.

Le magnétophone est sans doute le premier véritable outil de pitch shifting de l’histoire. Avec la bande magnétique, il est assez facile de modifier la vitesse de lecture ou d’enregistrement d’un son pour modifier son timbre et sa hauteur. On voit apparaitre les premiers effets sonores et voix transposés dans les cartoons dès les années 40.

Cendrillon, produit par les studios Disney en 1950, est un des plus beaux exemples. En effet, la majorité des personnages du film ont une voix « pitchée ».

 2 Années 80 : les samplers

 

Les premier samplers ( ou échantillonneurs) électroniques se répandent dans les années 80. (Lire aussi Qu’est-qu’un instrument virtuel). Ils permettent de lire des échantillons de son à des hauteurs différentes au moyen d’un clavier. Leur simplicité ouvre la voie à de nouvelles applications du pitch shifting, en particulier pour la composition musicale.

Dans Terminator 2, le theme musical du robot T1000 est construit autour de samples de trompettes baissées de plusieurs octaves. Elle se transforment en une sorte de respiration artificielle qui évoque un coeur de robot.

3 Années 2000 : les outils informatiques

 

Les progrès en matière de traitement numérique du signal permettent progressivement de s’affranchir de la contrainte du ré-échantillonnage. Il n’est plus nécessaire de changer la vitesse de lecture d’un son pour modifier sa hauteur, ce qui ouvre beaucoup de nouvelles perspectives.

Le pitch shifting devient accessible sous forme de plugins et de manière native dans tous les séquenceurs. Certains algorithmes sont conçus pour conserver le timbre, le rythme, modifier seulement les formants, etc. Chaque paramètre : hauteur, durée et timbre, devient indépendant. Des outils comme Melodyne permettent de corriger la hauteur d’un tout en conservant ses formants.

En musique, on peut désormais modifier le tempo d’un morceau sans changer sa tonalité (ou inversement), ce qui offre des possibilités infinies pour les DJs.

Le célèbre outil Autotune, conçu pour corriger en temps réel la justesse de la voix, est pour la première fois détourné en 1998 par Cher, inventant ainsi « l’effet Autotune ».

4 Les micros ultrasoniques : le futur du pitch shifting ?

 

Les microphones sont habituellement conçus pour enregistrer la même gamme de fréquence que l’oreille humaine. Mais depuis quelques années, on voit apparaitre de nouveaux microphones capables d’enregistrer des fréquences ultrasoniques allant jusqu’à 100 000 Hz. A quoi cela peut-il servir ?

Quand on baisse la hauteur d’un son, on transpose tous ses composants vers le grave. Si les plus hautes fréquences captées par le micro sont les mêmes que les plus hautes fréquences audibles, alors le pitch shifting va entrainer une perte d’aigus audible dans le son. Si on capte également les fréquences ultrasoniques, ces dernières baissent et deviennent audibles, prenant la place des fréquence aiguës qui ont été baissées. Le son reste alors défini sur toute la plage de fréquences de l’audition, même en baissant sa hauteur de deux octaves.

Voici un exemple : une simple vocalisation enregistrée avec un micro standard et un micro ultrasonique. Les deux sons ne paraissent pas très différents à l’oreille, mais quand on les baisse de 2 octaves, la différence est flagrante : le deuxième son est beaucoup plus clair et défini.

Sanken 100k pitch shift explication

Conclusion : Le pitch shifting, un outil de sound design incontournable

 

Aujourd’hui, on peut utiliser le pitch shifting grâce à une immense palette d’outils, pour manipuler le son et sa hauteur dans des proportions extrêmes. Le pitch shifting permet de modifier l’émotion véhiculée par un son et le rendre complètement méconnaissable. Pour transformer des effets sonores, ajuster des sons à la tonalité d’une musique ou encore créer des voix de personnages amusants ou monstrueux, la seule limite est notre imagination.

Je terminerai par un exemple que je trouve brillant de simplicité et d’efficacité. Dans La communauté de l’anneau, de Peter Jackson, il y a une scène dans laquelle l’elfe Galadriel est soudainement en proie au pouvoir de l’anneau. Le sound designer Mike Hopkins a demandé à Cate Blanchett, qui incarne Galadriel, d’enregistrer deux fois son texte, une fois à vitesse normale et une fois en parlant légèrement plus vite. La deuxième prise a ensuite été ralentie (donc rendue plus grave) d’un ton et mélangée à la première pour créer une double voix démoniaque.

Photos by Nicolas Titeux and Nam Anh on Unsplash.

Also Read:
rss
Facebooktwitterlinkedinmail