Les
logiciels musicaux proposent à leurs utilisateurs une playlist composée
de musiques jamais entendues tous les lundis en se basant sur leurs
habitudes. Pour se faire ces plateformes de streaming musicales
utilisent plusieurs méthodes. Cette approche permet de créer un système
qui comble les défauts de chaque modèle.
Il y a trois modèles principaux :
· Modèle de filtrage collaboratif, qui fonctionne en réalisant une analyse comportementale.
· Modèle de traitement automatique du langage naturel (NLP), qui fonctionne en réalisant une analyse de texte.
· Modèle audio, qui fonctionne en réalisant une analyse directe de son.

1/ Le Modèle de filtrage collaboratif
Il
travaille sur la récupération des différentes données capables
d’enrichir la compréhension des goûts des utilisateurs, cela se produit
de façon implicite en prenant en compte plusieurs indicateurs : le
nombre d’écoutes d’un titre, la sauvegarde d’un titre, la visite d’une
page d’un artiste après son écoute…
De
par cette myriade de données, les plateformes musicales peuvent
constituer une fiche personnelle des auditeurs. C’est ici que la méthode
de filtrage collaboratif peut se mettre en marche.
· L’utilisateur 1 aime les titres A,B,C
· L’utilisateur 2 aime les titres A,B,C,D
Il
est par conséquent probable que le titre D plaise à l’utilisateur 2.
Aussi, pour factoriser sur des centaines de données et des millions
d’utilisateurs, une grande marque de streaming musicale suédoise utilise
un système matriciel sous Python.

Chaque
ligne représente un utilisateur parmi 150 millions et chaque colonne
représente une musique parmi 30 millions. Ainsi, par une factorisation
matricielle sur Python, on obtient plusieurs vecteurs d’utilisateurs
combinés avec leurs vecteurs de musique correspondant.
Le
modèle de filtrage collaboratif va permettre de retrouver les
utilisateurs avec les goûts musicaux les plus proches afin de faire des
choix pertinents.
2/ Le Modèle de traitement automatique du langage naturel
Cette
méthode concerne l’application de techniques informatiques sur les
aspects du langage humain par la lecture d’articles, de blogs et
d’autres textes sur internet. Le logiciel musical parcourt le web et
cherche de façon automatique toutes les informations relatives à la
musique, en essayant de comprendre le texte des internautes.

Typiquement,
une stratégie appelée les « meilleurs mots » est couramment utilisée.
Chaque artiste et chaque musique possèdent des milliers de mots
associés. Ces mots sont par ailleurs changés quotidiennement. Par le
biais du nombre d’occurrences, chaque mot a donc un poids associé qui
révèle son niveau de pertinence à l’évocation de la musique ou de
l’artiste. S’ensuit, comme pour le modèle de filtrage collaboratif, un
système de comparaison des musiques grâce au système de poids des mots.
3/ Le Modèle audio
Ce modèle à un avantage sur les deux autres. Il permet de plus rapidement catégoriser les nouvelles musiques.
Supposons
qu’un ami, auteur compositeur, place une nouvelle musique sur une
plateforme. Cette musique aura environ 50 écoutes, très peu pour avoir
une pertinence sur le modèle de filtrage collaboratif, et encore moins
pour le modèle de traitement automatique du langage naturel.

Le
modèle audio est donc beaucoup plus performant sur cet aspect car il
utilise le réseau de neurones convolutifs, technologie initialement
adaptée pour la reconnaissance faciale. Elle utilise des fonctions
mathématiques à plusieurs paramètres, qui pré-traitent des quantités
d’informations sur une piste sonore ajustée, comme le ferait un cerveau,
reconnaissant les motifs redondants. En subissant ces traitements, la
musique est modélisée selon plusieurs prismes.
Ainsi,
le réseau de neurones donne sa compréhension de la piste, et renvoie
plusieurs données d’analyses, compatibles à une comparaison, comme le
tempo, les accords, le niveau de son, le temps… Au final, la
compréhension de ces caractéristiques clés permet de trouver des
similarités fondamentales entre les pistes sonores.
Voici
les bases des trois principales méthodologies, qui sont combinées pour
proposer aux auditeurs un choix adapté à leurs préférences musicales.

Les problématiques liées à la Data et au Big Data sont au cœur du quotidien d’Inhérence (cabinet de conseil spécialisé dans le management de l’information et membre de l’écosystème Alan Allman) depuis plus de 10 ans. Le sujet de la musique en ligne rentre dans cette logique puisque les plateformes de téléchargement utilisent des méthodes prédictives.
Contact : contact@inherence.fr
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire