Niland : no song is an island !

Starting blocks

#moteur/API de recherche #recommandation #découverte musicale #traitement du signal

Niland, c’est l’aventure entrepreneuriale vécue initialement par deux chercheurs de l’Ircam, rejoints ensuite par un jeune entrepreneur. Ou comment passer d’un post-doctorat sur la similarité audio à la proposition de solutions pour la recommandation et la recherche musicale. Tout cela grâce à une technologie de pointe unique au monde. Rencontre avec Damien Tardieu, fondateur et CEO.

À mi-mois, on lève la tête du guidon et on s’intéresse à l’innovation. Starting Blocks c’est des entreprises, des activités innovantes, et celles et ceux qui les font ! Et tout ça, dans la musique !



#moteur/API de recherche #recommandation #découverte musicale #traitement du signal

Site web - Répertoire Irma


Contrats aux États-Unis, accord avec la plateforme 1D Touch, prospection en Asie… Le début d’année 2015 s’annonce chargé pour Niland. Depuis 2013, la startup développe une API de recherche et de recommandation musicale. Sa spécificité : l’automatisation complète de la recherche dans des grands catalogues musicaux, grâce à l’analyse algorithmique du signal acoustique. Aujourd’hui, c’est une des plus prometteuses jeunes pousses françaises du secteur musical, installée depuis septembre dernier chez Paris incubateur, dans le XXe arrondissement. Une levée de fonds auprès d’IT Translation tout juste bouclée, Niland annonce pour 2015 la sortie d’une API orientée grand public. Avec une ambition simple, mais de taille : permettre au plus de gens possible de découvrir de la musique, et favoriser ainsi la diversité. Pour Damien Tardieu, « ce serait une belle réussite. C’est très ambitieux, si l’on considère que le numérique, bien que proposant des moyens pour renforcer cette diversité, a plutôt eu tendance à avoir l’effet inverse ».

Une technologie « de laboratoire »

Août 2010. Jeunes chercheurs, Damien Tardieu et Christophe Charbuillet se rencontrent à l’Ircam, lors d’un second post-doctorat, pour travailler sur la similarité audio. Le premier est docteur de l’Ircam, pour son travail sur l’orchestration automatique, et le second, docteur de l’université Paris VI-Pierre et Marie Curie, pour son travail sur la reconnaissance de locuteurs.

Capitalisant sur leurs expériences, ils réutilisent des technologies venues de la reconnaissance de locuteur (domaine de recherche plus avancé, dont les enjeux potentiels entrainent des financements plus importants) pour formaliser leur algorithme. En un an et demi, la technologie d’écoute et d’analyse automatique de musique (machine listening) est développée. Et les premiers résultats ne se font pas attendre. Deux années de suite, ils sont distingués par le Mirex (Music information retrieval evaluation exchange) comme meilleure technologie mondiale de reconnaissance. Les tests auprès d’auditeurs sont également très concluants. En comparaison de la recommandation réalisée "humainement" par un site connu, leur système s’avère dans 50% des cas plus performant.

On est alors début 2012. Boostés par ces premiers résultats, et encouragés par la dynamique mondiale autour de la recommandation musicale, les deux chercheurs décident de changer de vie. Exit la recherche publique, direction l’entrepreneuriat !

L’apprentissage de l’entrepreneuriat

Si les deux compères sont des pointures dans leur domaine, créer une entreprise, c’est une autre affaire. « On était des chercheurs, on ne connaissait rien à la création d’entreprise. C’est en rencontrant les créateurs de Weezic, (startup qui travaille sur la partition augmentée, ndlr), que nous avons eu connaissance d’Agoranov ». Après 6 mois de réflexion sur le business model, ils postulent à l’incubateur, qui a pour mission de faciliter la création d’entreprises innovantes liées à la recherche publique, et se présentent au concours de l’innovation du ministère de la Recherche, avec succès. Pendant un an, ils vont plancher sur l’élaboration de l’entreprise et la construction d’un premier produit en version beta.

C’est à ce moment-là que la que se fait la rencontre avec celui qui deviendra le 3ème co-fondateur : Johan Pagès. Ce dernier est alors "jeune entrepreneur en résidence" à Agoranov. Le but de ce programme : faire en sorte que ces entrepreneurs se fassent débaucher par les entreprises qu’ils aident. Et c’est exactement ce qu’il se passe ! Diplômé de Sciences Po Paris, passé par le business development en Asie et la direction stratégique de la Fnac, Johan Pagès va accompagner Niland, et prendre en charge le marketing et l’interface produit. C’était le complément de compétences idéal pour lancer la startup. « Plusieurs clients nous ont même dit que c’était grâce à lui que nous étions sortis du bois. Johan nous donne une image, une visibilité ». L’entreprise est créée officiellement en août 2013, un an et demi après avoir quitté le monde de la recherche.

Le temps du positionnement

JPEG - 57.2 ko
L’équipe de Niland

Le temps est alors à la recherche d’argent. Frédéric Monvoisin et Fabrice Dumont, fondateurs du label Green united music, croient tout de suite au projet. Ils deviennent les business angels de Niland, investissent et accompagnent la startup. Il est aussi temps de se lancer dans la tournée des salons, pitch sessions et autres tech meetings. En février 2014, l’équipe se rend au Midem. L’occasion de faire des tests, des démos, des rencontres… D’abord auprès des librairies musicales. Ce qui leur permet de se rendre compte qu’ils n’ont pas suffisamment ciblé leurs prospects. Niland se recentre alors sur une clientèle précise, plus versée dans la culture de l’automatisation : les plateformes web de vente de musique aux professionnels. « Ils ne jouent pas le rôle d’un music supervisor, ils ne souhaitent pas intervenir dans le choix et la vente, ce type de client est donc plus naturellement intéressé par notre technologie ». Le premier contrat est signé outre-Atlantique.

A partir d’août 2014, ils démarchent aux États-Unis, au Luxembourg et en Suède. En septembre de la même année, ils signent avec un deuxième client, positionné sur la compilation. Actuellement, des négociations sont en cours avec des plateformes américaines de musique pour des usages professionnels. Sans non plus délaisser le marché de la recommandation pour le grand public, d’où la signature avec 1D Touch. Aujourd’hui, l’entreprise a grossi, et compte désormais 6 salariés, majoritairement sur la R&D.

No song is an Island….et toute ont une signature acoustique

« Nous ne faisons pas de la reconnaissance. Nous ne sommes pas Shazam. Nous faisons de l’aide à la recommandation ». Concrètement, comment cela fonctionne ? Les clients envoient leur catalogue sous forme de mp3. L’algorithme de Niland permet d’extraire du signal acoustique une signature unique de quelques milliers de chiffres qui contient tous les aspect importants de la musique (rythme, timbre, instruments, mood… ). Il est alors possible de calculer la distance entre deux signatures, comme on calculerait la distance entre deux points sur une carte. Et savoir si deux chansons sont très proches, proches ou plus éloignées. Et pour cela, 80 nanosecondes suffisent ! On voit bien tout l’intérêt pour les plateformes dont les catalogues comptent plusieurs millions de titres : « sur Soundcloud, c’est environ 15h de nouveau son uploadé par minute ! »

A partir de ces informations, Niland met à disposition de ses clients des fonctionnalités de recherche de musique à musique, de recommandation musicale et de classification (instruments, rythmes…). Avec comme produit phare le moteur de recherche Siilar. « Notre différence fondamentale avec les autres outils, c’est que l’empreinte acoustique que nous déterminons n’est pas compréhensible par un être humain. Il s’agit d’une description qui n’utilise pas des aspects musicologiques compréhensibles ». A partir de cette empreinte, par des techniques de machine learning, donc d’intelligence artificielle, l’algorithme apprend toutes les signatures qui relèvent du rock, ou de la pop, celles qui sont tristes ou joyeuses… Quand un nouveau titre est "scanné", l’algorithme est capable de savoir si c’est une femme qui chante, s’il y a du violon, si c’est du rock, si c’est joyeux…

Outre la capacité à traiter automatiquement de grandes quantités de titres, « la plus-value apportée par notre système, c’est quand il n’y a pas de données extérieures disponibles ». Comme pour les bases de données de musique fonctionnelle ou d’illustration, pour lesquelles les métadonnées sont assez pauvres, voire inexistantes. Niland se pose aussi en complément des procédés classiques de description et de qualification des données. Pour les sites grand public, c’est un outil puissant de valorisation des catalogues moins populaires, car il permet d’avoir une recommandation liée à des artistes connus. C’est d’ailleurs ce qui a séduit 1DTouch, plateforme de streaming équitable dédiée aux contenus culturels indépendants. Pour faire simple, cela leur permet de faire de la recommandation de type : on n’a pas Rihanna, mais tel et tel artiste du catalogue s’en rapproche. Tout en ne sous-estimant pas les limites de la méthode : « pour l’usage grand public, il y a deux choses que l’on peut difficilement décrire par le signal : la popularité et le talent. Ce sont donc deux critères pour lesquels il y aura toujours besoin de datas externes. Mais on n’est encore qu’au tout début de la recommandation basée sur le signal, amenée à se développer fortement. »

Une technologie transposable ?

Une question se pose alors pour l’avenir de Niland. Si les trois fondateurs ont réussi à développer et commercialiser une technologie aussi puissante pour la musique, celle-ci est-elle potentiellement transposable à d’autres types de contenus ? D’autant plus que le marché de la musique n’est pas non plus énorme en termes de chiffre d’affaires. « Il y a deux types de données auxquelles naturellement nous pourrions nous étendre : la voix, pour tout ce qui est reconnaissance de locuteurs, et la vidéo. Il y aurait un gros travail d’adaptation à mener, mais c’est faisable, et on y pense. Reste à savoir s’il est pertinent de faire de la recherche pour ce type de contenus. Comme pour la musique, il y a potentiellement un marché professionnel, une sorte de Getty images de la vidéo, mais pour le grand public, cela reste à voir ». Mais l’avenir immédiat, pour Niland, c’est déjà de définitivement convertir une technologie de pointe en réussite industrielle. Et c’est plutôt bien parti…


Présentation vidéo de Siilar : the music search environment for professionals


Romain Bigay