jeudi 28 février 2008

Long tail

J’ai choisi comme sujet aujourd’hui un phénomène que je trouve particulièrement intéressant puisqu’on le retrouve un peu partout, dès qu’il s’agit de popularité. Je vais donc parler du phénomène de longue traîne (long tail pour les anglophones). J’en ai entendu parler pour la première fois sur le blog de Louis Naugès (passionnant à suivre si vous êtes dans le monde IT). Puis j’en ai à nouveau entendu parler ça et là, comme une sorte de mode, puis j’ai été embauché pour travailler sur un projet qui exploite pleinement ce phénomène.

La longue traîne, qu'est ce que c'est ?

C’est la partie jaune de la courbe suivante, qui représente une population d’éléments, classés par ordre décroissants de popularité. Cela peut par exemple correspondre au classement des occurrences d’un mot dans une langue. On peut parier que les mots “le”, “et”, “est”, ... reviendront bien plus fréquemment que “bafouille”, “bévue” ou “billevesée”. Mais au final, la somme des occurrences des mots les moins fréquents sera plus importante que celle des mots le plus utilisés, ou, pour le formuler de manière plus visuelle, l’aire de la surface jaune sera plus importante que celle de la surface verte.

La courbe suit une loi de Zipf :

C’est bien joli me direz-vous, mais en quoi est-ce intéressant ? Cette courbe est parfaite pour représenter une demande de consommateur. On pourrait prendre également comme exemple la demande en vidéos, en livres, en articles spécialisé, etc. L’important ici est que le nombre total de demandes pour les produits les moins populaires, par effet d’accumulation, peut se retrouver largement supérieur à celui des produits les plus populaires.

Un peu de math

La loi de Zipf nous donne donc cette formule :

n est le n-ième “objet” le plus populaire
K est une constante, elle est égale à la valeur représentant la popularité de l’objet le plus populaire (et dépend donc uniquement de la métrique utilisée pour calculer cette popularité, e.g. nombre de téléchargements, ...)
s est le paramètre de Zipf qui, en gros, joue sur le nombre d’objets les plus populaires, c’est en quelque sorte la clé de la formule.


Un modèle c’est bien, mais dans la réalité ?

Petit exemple, iTunes (le service de vente de musique en ligne d’Apple) par exemple vend chaque mois 98% de son catalogue ! La boutique en ligne profite du fait que le coût de stockage et de distribution de ses titres est totalement marginal. Alors qu’avec des magasins classiques (des disquaires, pour rester dans le monde de la musique) le stockage est limité à la taille du magasin l’offre est nécessairement réduite, le vendeur se tournera alors naturellement vers les titres qui lui rapporteront le plus, la dématérialisation du support permet une offre potentiellement illimitée.
Pour continuer dans les exemples amazon profite également des conséquences de la longue traîne.

J’ai constaté récemment que ma consommation de musique suivait ce même schéma. C’est en regardant mon historique des écoutes sur last.fm que je m’en suis aperçu. Je pense qu’il en serait de même avec ma vidéothèque en regardant la fréquence d’apparition des acteurs, par exemple. Et c’est logique, dans un sens : on a tous des chanteurs, des acteurs préférés, et parmi leur production des morceaux ou des films préférés. Et au final seulement une petite partie d’un album, par exemple, est vraiment bien (ou en tout cas vraiment appréciée - sauf cas particulier, bien entendu).

On constate donc que cette loi de répartition de popularité se retrouve à de nombreuses échelles et sûrement à d’autres cas non évoqués dans cet article.



À lire également sur le sujet :

lundi 18 février 2008

Gérad Klein, chapitre 3

Définitivement j'accroche pas, bon c'est comme ça. sur la douzaines de nouvelles que j'ai lues deux sortent un peu du lot (celles du billet précédent) et deux autres - peu-t-on vraiment les appeler "nouvelles", je dirais plutôt blagues - méritent que je les raconte ici (je cite de mémoire) :

Bien entendu, lors de la création du premier robot intelligent, on y a inclut les trois lois de la robotique d'Asimov.
Lorsque le robot s'éveilla pour la première fois, avant tout chose il demanda :
- Qu'est-ce qu'un être humain ?

Il n'eut jamais la réponse.


Petit rappel des lois de la robotique, pour ceux qui auraient oublié :
  • Première Loi : Un robot ne peut ni porter atteinte à un être humain ni, restant passif, laisser cet être humain exposé au danger ;
  • Deuxième Loi : Un robot doit obéir aux ordres donnés par les êtres humains, sauf si de tels ordres sont en contradiction avec la Première Loi ;
  • Troisième Loi : Un robot doit protéger son existence dans la mesure où cette protection n'entre pas en contradiction avec la Première ou la Deuxième Loi.

Deuxième "blague" :
Dans l'histoire bien connue du chevalier, de la princesse et du dragon, peu de gens connaissent la dernière réplique du dragon.
Ainsi donc, pourfendu et dans les derniers instants de sa vie, le dragon s'adressa au chevalier en ces termes :
- Avec la gueule que t'as tu aurais mieux fait de tuer la princesse et de m'épouser.


Ça ne va pas loin mais ça change des nouvelle où il ne se passe rien, avec on ne sait pas qui, on ne sait pas que et on ne sait pas où (le QQOQCP l'as dans l'os ;) )...

Jumper et Cloverfield

Hier et parce que je me suis aperçu pas hasard qu'il était sorti au ciné, je suis allé voir Jumper - que j'attendais avec impatience depuis plusieurs mois. Je l'attendais tellement que j'avais peur d'être déçu... et pour tout dire je le suis. Un peu. Disons que le film est tout simplement trop court, trop de pister sont lancées, trop de questions sont posées et au final l'histoire ne va pas très loin. Bon, vous me direz que c'est pour faire une suite. Je suis de cet avis, mais une suie aurai largement été faisable tout en en mettant plus dans le premier. Au final j'ai aimé, beaucoup, j regrette seulement quelques scènes supplémentaires (peut être en bonus dans le DVD ?).

Autre film du weekend Cloverfield. Celui-là je l'attendais beaucoup moins. Ce qui m'a fait m'intéresser à ce film est tout le marketing viral, plutôt bien orchestré, qui a précédé sa sortie. On suit donc les péripéties New-Yorkaises d'un groupe - de plus en plus réduit au fur et à mesure du film - de trentenaires insipides, peu attachants lors de l'attaque de la ville par des monstres. Bon, l'histoire est pas extra mais le film aurait pu être bien si - rayez la (les) mention(s) inutile(s) : le comportement les personnages était cohérent avec l'ampleur de la situation, le film ne sur-abusait pas du style vidéo amateur, on en savait un peu plus sur l'histoire, le jeu des acteurs était bon, ... je m'arrêtes là, ce film n'en mérite pas plus. Je suis juste content de ne pas avoir payé ma place.