Le labo de l'édition en flux RSS Le labo de l'édition sur facebook Le labo de l'édition sur youtube Le labo de l'édition sur flickr Le labo de l'édition sur twitter Le labo de l'édition sur scoopit Le labo de l'édition sur storify
Edition: quelle valeur ont les données?
Mardi 19 février 2013 à 18h30

Dans le cadre de la Social Media Week Paris

 

Dans le cadre de la Social Media Week, le Labo de l’édition organisait une conférence-débat mardi 19 février 2013 sur le thème « Edition : quelle valeur ont les données ?" .


La Social Media Week est une semaine de débats et conférences sur les enjeux du web, dédiés cette année au thème « Open & Connected ».

 

Virginie Rouxel, déléguée générale du Labo de l’édition et animatrice du débat, a introduit la soirée par une question de définition : de quoi parle-t-on quand on évoque les données dans le monde de l’édition ? si on commence par un focus sur ce qui entoure le livre :

 

Il y a tout d’abord les données directement liées au livre -  le titre,  le nom du ou des auteurs, son sujet, le prix de vente, la langue de sa rédaction - qui sont des données essentielles à diffuser pour qu’un livre puisse être brassé par les moteurs de recherche, tandis que le texte lui-même produit d’autres données : de lieux, personnages, concepts, occurrences diverses.

 

Mais il existe en regard de celles-ci des données d’une autre nature, produites en continu et souvent involontairement par les  internautes eux-mêmes qui n’ont pourtant rien à vendre. Nom, date de naissance, adresse de son domicile et adresse IP de nos ordinateurs, sexe, nombre d’amis déclarés ou glanés sur nos profils sociaux, clics, fréquence et temps de consultation d’un site, historique de nos achats, position géographique de nos téléphones mobiles: les renseignements  que nous inscrivons sur le web et toutes les traces que nous laissons derrière nous sont autant de données qu’il est désormais possible de capter en temps réel . Corrélées les unes aux autres, elles ouvrent la voie à l’anticipation des comportements, à la personnalisation des contenus par segmentation de l’audience, au risque pour l’internaute, en l’absence de régulation,  d’un brouillage entre données divulguées et données privées.

 

En est-on déjà là dans le secteur du livre? Les pratiques de lecture numérique émergentes ont un point commun : elles s’accompagnent de nouvelles intermédiations, celle des plateformes de vente et des supports de lecture, qui sont autant de capteurs de données. Quelles sont ces données collectées sur les lecteurs et leur façon de lire, qui les détient et comment circulent-elles ? Peut-on y interpréter nos goûts et le prix que nous sommes prêts à mettre pour nous divertir ou nous informer, ou y a-t-il encore loin du recueil à l’exploitation de nos données ? Dans cette phase où le livre numérique n’a encore qu’un maigre public, quelles données peut-on recueillir hors capteurs, auprès des lecteurs de livres papier ?

 

Les données seraient le nouvel « or noir», le fondement du web3 .0 devenu sémantique, qui bouleverse la chaîne de la valeur. Alors question : quels nouveaux modèles économiques adossés à la donnée peuvent émerger pour l’édition, entre  contribution, gratuité, monétisation des contenus et celle de l’audience ?

 

En explorant ce soir les termes de métadonnées, données sociales, CRM, big data ou data mining, nous allons tenter de comprendre les enjeux de l’univers des données pour l’édition, de la diffusion du savoir au financement de la création.

Pour répondre à ces questions, le Labo de l’édition avait invité professionnels du livre et entrepreneurs à présenter leur perspective sur l’enjeu des données de l’édition et leurs projets impliquant la gestion des données :

 

Virginie Clayssen, directrice de la stratégie digitale du groupe Editis, 2e groupe d’édition français, et filiale du groupe espagnol Planeta. Editis regroupe des maisons telles que Plon-Perrin, Robert Laffont, XO, ou La Découverte en littérature générale, mais aussi pour le secteur éducation Bordas, Nathan, les dictionnaires le Robert en référence, et des éditeurs de livres de poche comme 10-18 et Pocket. Editis a également une activité importante en tant que distributeur.

 

Hadrien Gardeur, co-fondateur en 2007 de Feedbooks, librairie 100% numérique qui permet le téléchargement d’ebooks libres ou payants sur tous supports mobiles.  Hadrien Gardeur est par ailleurs impliqué dans diverses instances techniques cherchant à promouvoir des standards pour la lecture comme le format epub et défend un Web Ouvert pour le Livre.

 

Christophe Camborde, après avoir fondé Steek en 2001, solutions de stockage de données revendu en 2010 (au groupe finlandais F-Secure), a créé en 2011 Ezakus-Labs, une plateforme de qualification d’audience, active en particulier auprès des éditeurs de contenus de presse, dont les Echos. Ezakus promet aux medias une personnalisation de l’expérience de l’internaute, à la fois en terme de contenus et de messages publicitaires reçus.

 

Vincent Puig, directeur adjoint de l’Institut de recherche et d’innovation du centre Pompidou créé en 2006 pour anticiper et analyser les mutations des pratiques culturelles permises par les technologies numériques.

 

Virginie Clayssen dans sa présentation a insisté sur l’importance pour les éditeurs de produire des métadonnées pour que les livres imprimés comme numériques soient identifiables, « trouvables », par les moteurs de recherche. Elle distingue les données en 3 catégories : « autour des livres » (les métadonnées), « dans les livres » (données d'indexation des contenus), « au sujet des livres » (ce qui s'échange et se dit sur leurs contenus).

 

 

 

Hadrien Gardeur a quant à lui concentré sa présentation sur la collecte et l’exploitation des données par un libraire numérique tel que Feedbooks, en distinguant entre les données attachées au contenu (langue, genre, marque éditoriale…) et les données attachées à l’utilisateur (langue, pays, sexe, périphérique d’utilisation…), entre les données d'exploitation utiles à son propre service et les données collectées qui définissent des paniers moyens d'achat ou des tendances émergentes de lecture numérique sur certains pays.

 

 

 

 

 

La présentation du modèle d’Ezakus par Christophe Camborde a permis d’aborder le sujet des big data pour l’édition, dont l’exploitation pourrait fournir au secteur un modèle économique pour les contenus gratuits, fondés sur la recommandation et la personnalisation des contenus et des messages publicitaires. Christophe Camborde a souligné l'appétit féroce des annonceurs pour obtenir de l'information sur les utilisateurs. Les techniques de traitement d'énormes volumes de données relèvent de modélisations mathématiques complexes, apanage des "data miners" et autres "data scientists" que Ezakus continue de recruter.

 

 

 

L’exploitation des données culturelles représente un enjeu économique pour les industries créatives, mais également un enjeu de diffusion des savoirs. Vincent Puig a présenté différentes expérimentations menées par l’IRI fondées sur les métadonnées culturelles, en laissant entrevoir les prolongements applicables au livre : système de visualisation du "bruit" possible autour d'un livre, éditorialisation participative des lecteurs via des outils contributifs, etc...