Empreinte acoustique
Une empreinte acoustique est un résumé numérique généré à partir d'un signal audio. Cette empreinte permet d'identifier un échantillon sonore, ou de localiser une séquence sonore dans une base de données audio.
Les utilisations pratiques sont multiples, par exemple l'identification de chansons, d'enregistrements, de mélodies, de publicités, d'émissions radio, d'effets sonores ou de séquences video entre autres.
Caractéristiques
Une empreinte acoustique doit satisfaire plusieurs conditions[1].
Spécificité
L'empreinte doit ĂȘtre assez prĂ©cise pour que deux sons trĂšs diffĂ©rents n'aient pas la mĂȘme empreinte.
Robustesse pour les distorsions
Un algorithme d'empreinte acoustique doit tenir compte des caractĂ©ristiques audibles du son. Si deux Ă©chantillons sont perçus comme identiques par l'oreille humaine, leur empreinte doit ĂȘtre Ă©gale ou trĂšs proche, mĂȘme si leur reprĂ©sentation numĂ©rique est trĂšs diffĂ©rente. Ă ce titre les empreintes acoustiques ne sont pas des empreintes au sens habituel du terme. La plupart des techniques de compression audio (MP3, WMA, OGG) produisent des changements importants dans l'encodage binaire d'un fichier audio, sans pour autant affecter la façon dont il est perçu. Un bon algorithme d'empreinte acoustique va permettre d'identifier un enregistrement mĂȘme aprĂšs qu'il a subi une telle compression. Une lĂ©gĂšre variation de vitesse ou un bruit lĂ©ger doit aussi ne pas trop changer l'empreinte.
Efficacité
Pour ĂȘtre utilisĂ©e, l'empreinte doit ĂȘtre facile Ă calculer, c'est-Ă -dire avoir une petite complexitĂ© en temps et facile Ă stocker, c'est-Ă -dire compacte, courte.
Implémentations
- AMG LASSO est un service commercial de reconnaissance lancé par All Media Guide en 2004.
- Audible Magic Corporation est un service commercial d'identification et de gestion du copyright.
- AudioID est une technologie commerciale de Fraunhofer pour reconnaissance acoustique automatique.
- LazyTune est un moteur de recherche qui utilise des empreintes acoustiques pour reconnaitre des fichiers audio.
- Gracenote's MusicID est un produit commercial qui utilise des techniques d'empreinte acoustiques pour identifier des morceaux (entre autres).
- Winamp version 5.5 utilise Gracenote avec le plugin "Nullsoft Playlist Generator".
- Foosic est un projet libre et gratuit qui utilise sa propre technologie d'empreinte.
- SoundHound (en) (anciennement Midomi) est un service commercial en ligne qui peut déceler l'équivalence entre deux extraits musicaux ou identifier une chanson que l'utilisateur chante ou murmure dans le micro de son PC.
- MusicBrainz est un projet libre et gratuit pour une base de données musicale.
- Shazam un service d'empreinte acoustique pour identification de morceaux par téléphone portable.
Voir aussi
- Code Parsons, une notation simplifiée du 'contour' d'une mélodie permettant la recherche
- Reconnaissance vocale
Notes et références
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « Acoustic fingerprint » (voir la liste des auteurs).
- Pedro Cano, Eloi Batlle, Ton Kalker et Jaap Haitsma, « A Review of Algorithms for Audio Fingerprinting », dans International Workshop on Multimedia Signal Processing, US Virgin Islands, décembre 2002) (lire en ligne).