Les logiciels musicaux proposent à leurs utilisateurs une playlist composée de musiques jamais entendues tous les lundis en se basant sur leurs habitudes. Pour se faire ces plateformes de streaming musicales utilisent plusieurs méthodes. Cette approche permet de créer un système qui comble les défauts de chaque modèle.
Il y a trois modèles principaux :
· Modèle de filtrage collaboratif, qui fonctionne en réalisant une analyse comportementale.
· Modèle de traitement automatique du langage naturel (NLP), qui fonctionne en réalisant une analyse de texte.
· Modèle audio, qui fonctionne en réalisant une analyse directe de son.
 
 
1/ Le Modèle de filtrage collaboratif

Il travaille sur la récupération des différentes données capables d’enrichir la compréhension des goûts des utilisateurs, cela se produit de façon implicite en prenant en compte plusieurs indicateurs : le nombre d’écoutes d’un titre, la sauvegarde d’un titre, la visite d’une page d’un artiste après son écoute…
De par cette myriade de données, les plateformes musicales peuvent constituer une fiche personnelle des auditeurs. C’est ici que la méthode de filtrage collaboratif peut se mettre en marche.
· L’utilisateur 1 aime les titres A,B,C
· L’utilisateur 2 aime les titres A,B,C,D
Il est par conséquent probable que le titre D plaise à l’utilisateur 2. Aussi, pour factoriser sur des centaines de données et des millions d’utilisateurs, une grande marque de streaming musicale suédoise utilise un système matriciel sous Python.
Chaque ligne représente un utilisateur parmi 150 millions et chaque colonne représente une musique parmi 30 millions. Ainsi, par une factorisation matricielle sur Python, on obtient plusieurs vecteurs d’utilisateurs combinés avec leurs vecteurs de musique correspondant.
Le modèle de filtrage collaboratif va permettre de retrouver les utilisateurs avec les goûts musicaux les plus proches afin de faire des choix pertinents.

2/ Le Modèle de traitement automatique du langage naturel
Cette méthode concerne l’application de techniques informatiques sur les aspects du langage humain par la lecture d’articles, de blogs et d’autres textes sur internet. Le logiciel musical parcourt le web et cherche de façon automatique toutes les informations relatives à la musique, en essayant de comprendre le texte des internautes.

 
 
Typiquement, une stratégie appelée les « meilleurs mots » est couramment utilisée. Chaque artiste et chaque musique possèdent des milliers de mots associés. Ces mots sont par ailleurs changés quotidiennement. Par le biais du nombre d’occurrences, chaque mot a donc un poids associé qui révèle son niveau de pertinence à l’évocation de la musique ou de l’artiste. S’ensuit, comme pour le modèle de filtrage collaboratif, un système de comparaison des musiques grâce au système de poids des mots.

3/ Le Modèle audio
Ce modèle à un avantage sur les deux autres. Il permet de plus rapidement catégoriser les nouvelles musiques.
Supposons qu’un ami, auteur compositeur, place une nouvelle musique sur une plateforme. Cette musique aura environ 50 écoutes, très peu pour avoir une pertinence sur le modèle de filtrage collaboratif, et encore moins pour le modèle de traitement automatique du langage naturel.
Le modèle audio est donc beaucoup plus performant sur cet aspect car il utilise le réseau de neurones convolutifs, technologie initialement adaptée pour la reconnaissance faciale. Elle utilise des fonctions mathématiques à plusieurs paramètres, qui pré-traitent des quantités d’informations sur une piste sonore ajustée, comme le ferait un cerveau, reconnaissant les motifs redondants. En subissant ces traitements, la musique est modélisée selon plusieurs prismes.
Ainsi, le réseau de neurones donne sa compréhension de la piste, et renvoie plusieurs données d’analyses, compatibles à une comparaison, comme le tempo, les accords, le niveau de son, le temps… Au final, la compréhension de ces caractéristiques clés permet de trouver des similarités fondamentales entre les pistes sonores.
Voici les bases des trois principales méthodologies, qui sont combinées pour proposer aux auditeurs un choix adapté à leurs préférences musicales.
Les problématiques liées à la Data et au Big Data sont au cœur du quotidien d’Inhérence (cabinet de conseil spécialisé dans le management de l’information et membre de l’écosystème Alan Allman) depuis plus de 10 ans. Le sujet de la musique en ligne rentre dans cette logique puisque les plateformes de téléchargement utilisent des méthodes prédictives.
Contact : contact@inherence.fr

Aucun commentaire:

Enregistrer un commentaire