Découvrez le 3è numéro de Lille by Inria, le magazine du centre de recherche Inria Lille - Nord. Dossier spécial sur les données, matière première et source d'enjeux pour le numérique.
Inria - Cybersecurity: current challenges and Inria’s research directions
Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique
1. focus >
Keycoopt
et inria
focus >
Tan : LES transitions
S'animENT
dossier >
les orpailleurs
du big data
#03
DOSSIER
Les donnees
matiÈre premiÈre
et SOURCE D'enjeux
POUR LE numÉrique
juin 2016
LE MAGAZINE DU CENTRE INRIA LILLE - NORD EUROPE
2. eDi
TO C’est avec une grande joie que j’ai signé, le 26 avril dernier, la promesse de
vente d’un nouveau bâtiment pour notre centre de recherche. Grâce aux
financements du Conseil régional des Hauts-de-France, de la Métropole
Européenne de Lille et d’Inria, ce troisième bâtiment lillois, situé au sein
d’EuraTechnologies, accueillera dès 2018 plusieurs de nos équipes-
projets et InriaTech, la première plate-forme de transfert technologique
de l’institut initiée à Lille.
Suite aux recrutements soutenus ces dernières années (six chercheurs
en 2014 et six chercheurs en 2015) et au développement de dispositifs
favorisant le transfert technologique et la création de start-up, il était
essentiel pour le centre Inria de Lille de répondre aux enjeux de l’institut
qui favorise l’excellence scientifique au service du transfert technologique
et de la société. Cette implantation, au cœur de l’écosystème de la French
Tech lilloise, sera dédiée principalement à la donnée et au logiciel libre,
priorités scientifiques du centre.
La récolte, le traitement ou encore la visualisation des données sont
des sujets de recherche faisant l’expertise de plusieurs de nos équipes-
projets dont la renommée est internationale. Cette expertise sur la “ data ”,
sollicitée par les entreprises de la région, nous permet de mettre en place
des collaborations répondant à un besoin fort de transfert technologique
et ce, grâce notamment à InriaTech dont nous fêtons fièrement un an
de succès.
C’est donc tout naturellement que ce numéro 3 de notre magazine est
dédié à la donnée, thématique de recherche phare de notre institut et du
centre de Lille en particulier, et faisant l’objet d’un projet emblématique
inscrit dans le contrat de plan État-Région 2015-2020.
Je vous souhaite une bonne lecture et vous donne d’ores et déjà rendez-
vous le 20 octobre prochain, dans nos bâtiments à la Haute-Borne, afin de
célébrer le recrutement du cinquantième chercheur Inria à Lille. Ce sera
l’occasion de discuter de l’impact de notre engagement sur l’écosystème
euro-régional en termes d’emplois, d’innovation et d’enjeux stratégiques.
David Simplot-Ryl
02
4. 04
// face a face
Interviews
Pierre de Saintignon >
président d’Euratechnologies
> Quels sont les atouts de
notre région dans le domaine
de la recherche numérique ?
Ils sont nombreux, à l’image
des travaux qui sont menés par
Inria, par les universités et par
les laboratoires dans la région.
Le numérique a pris une place
prépondérante dans les thématiques
de recherche, dans la compétence
des chercheurs en activité et dans
les ambitions affichées par les au-
torités académiques locales. Avec la
fusion, notre recherche se rapproche
géographiquement des plus grands
centres de recherches parisiens et
se doit de jouer la complémentarité.
L’objectif est d’atteindre le monde
de l’entreprise et de favoriser les
échanges entre chercheurs et
industriels en utilisant différentes
stratégies de promotion (Inbound
ou Outbound). Nous devons faire
des efforts pour le transfert vers les
entreprises, pour rendre encore plus
compétitives et valoriser nos ETI,
PME, PMI et start-up.
> Quels sont, selon vous, les
grands enjeux à venir autour des
données ?
Chaque jour, il est généré 2,5
trillions d’octets de données. 90%
de ces données ont été créées au
cours des deux dernières années.
Elles proviennent en partie de
l’utilisation d’ordinateurs ou de
téléphones connectés à internet.
Depuis plusieurs années déjà, nous
avons compris les enjeux de cette
question (acquisition, traitement,
gestion et valorisation de données
informatiques massives), qui
constitue un vecteur de dévelop-
pement particulièrement porteur
pour l’avenir. En effet, l’analyse
des volumes massifs de données,
sous des conditions d’anonymat
et de préservation de la vie privée
soigneusement encadrées, peut
être à la source du développement
de nouvelles formes de collaboration
entre les grands industriels, les
PMEs, les acteurs de la recherche et
les collectivités locales. Ensemble,
ils peuvent inventer de nouveaux
produits, développer de nouveaux
usages et services à la population
mais aussi créer de l’emploi. Pour
faire émerger les domaines d’appli-
cation concrets, il faut inventer de
nouvelles techniques de compilation
et d’analyse qui permettront d’exploi-
ter efficacement un tel volume de
données. Le projet TERRIL, confié
par la Région à EuraTechnologies
vise à développer des programmes
de recherche dans ce domaine. La
Troisième Révolution Industrielle
doit pouvoir intégrer cette notion de
big data comme technologie d’appui
aux réponses à apporter aux défis
écologiques et économiques qui se
présentent à nous.
> Quel regard portez-vous sur
l’excellence scientifique incarnée
par Inria ?
Tout d’abord, nous avons été fiers et
honorés d’accueillir Inria à EuraTech
parmi les pionniers de cette belle
aventure. Ce premier établissement
de recherche s’est naturellement im-
posé comme une référence nationale
et internationale, aux côtés d’autres
acteurs académiques comme HEI et
nous a donné l’occasion de devenir
crédible aux yeux de l’industrie.
L’implantation du Plateau a été un
formidable accélérateur de transfert.
L’excellence scientifique incarnée par
Inria alliée à l’excellence économique
d’EuraTech portée par un réseau
d’entrepreneurs visionnaires et créa-
tifs constitue un modèle du genre. Il
s’agit d’un écosystème unique en
Europe et dans le monde, au service
de toute une région en mutation.
Il nous faut maintenant passer la
vitesse supérieure en soutenant la
création de plus d’entreprises inno-
vantes. Inria représente un partenaire
précieux pour ces entrepreneurs en
quête de développement technolo-
gique. Cette collaboration valorise
nos entreprises en les rendant en-
core plus compétitives notamment
à l’export.
º euratechnologies.com
5. #03 juin 2016 05
Anne Debertonne >
co-fondatrice de What a Nice Place
> Quelle est la place de la
recherche en sciences du
numérique chez “ What a Nice
Place ” ?
Les sciences du numérique sont
arrivées assez tardivement dans
la construction du projet What A
Nice Place. Avec nos formations en
commerce et dans le marketing/web,
nous nous sommes plutôt centrés en
priorité sur l’usage et l’expérience uti-
lisateurs. Parallèlement, nous avons
développé en interne un outil qui a
rapidement affiché quelques fai-
blesses. C’est à ce moment que nous
avons commencé à échanger avec
Inria pour résoudre ces problèmes.
Rapidement, cette collaboration
nous a offert de nouvelles perspec-
tives d’optimisation de nos process
internes mais a aussi fait émerger
de nouvelles idées pour aller plus
loin en termes d’expérience client.
Nous avons alors pris conscience
de la place que devait prendre la
recherche en sciences numériques
chez WANP en interne et à travers
notre collaboration avec les équipes
Inria pour les sujets liés à la R&D.
> Quels sont, selon vous, les
grands enjeux à venir autour des
données ?
Dans ce domaine, la dimension
collaborative représente un enjeu
important. Entre les phases de trai-
tement, de manipulation et d’analyse
des données, des spécialistes
issus de domaines aussi différents
que le numérique ou le marketing
interviennent. Il y a des enjeux de
communication importants pour ras-
sembler ces deux mondes qui n’ont
pas forcément appris à travailler
ensemble. Dans le domaine, les dif-
ficultés de recrutement représentent
aussi un sérieux obstacle. Dans les
entreprises et plus largement dans le
monde actuel, les besoins en analyse
et manipulation de données vont
croissant mais les candidats sont
rares et chers sur le marché. Il est
difficile de fidéliser ce genre de profil.
Par ailleurs, les formations sont ma-
joritairement destinées à des postes
orientés “ grandes structures ”
avec des candidats qui maîtrisent
l’analyse des données mais peu les
développements. Enfin, la systéma-
tisation des processus d’analyse
évolutive représente un autre enjeu.
Il faut imaginer des solutions à
apprentissage actif, plus complexes,
mais indispensable pour construire
des solutions pérennes.
> Quel regard portez-vous sur
l’excellence scientifique portée par
Inria ?
Inria est devenu un partenaire pré-
cieux. Cette collaboration a changé
mon regard sur le domaine de l’excel-
lence scientifique qui me paraissait
difficilement accessible. Inria traite
effectivement de problématiques
complexes mais les interlocuteurs
ont toujours à cœur de se mettre
à la portée de leur interlocuteur. La
politique d’Inria repose aussi sur
l’aspect collaboratif. Sur la base
d’échanges, chacun peut mettre
ses compétences au service d’une
problématique.
º whataniceplace.com
6. 06
De quoi parle-t-on
quand on parle de
données ?
D’où proviennent
les données ?
Quand parle-t-on
de BIG DATA ?
Sur quels sujets
portent les
recherches menées
chez Inria ?
Qu'est-ce qui
change avec les
métadonnées ?
Elles peuvent être mesurées par le biais d’ins-
truments physiques comme des capteurs ou des
équipements scientifiques. Elles peuvent être
produites par des logiciels de manière autonome
(par simulation numérique) ou en réaction à des
événements (suite à des interactions avec d’autres
logiciels ou avec des utilisateurs, par exemple).
Elles peuvent bien sûr aussi être produites "à la
main" par des personnes.
Sur la modélisation, la représentation, l’interroga-
tion et le stockage des données. Sur les données
incertaines, sur le contrôle d’accès, la confidentia-
lité. Sur l’extraction de connaissance, l’analyse de
données. Sur l’apprentissage et les systèmes de
recommandation. Sur l’optimisation des processus
de traitement et de décision. Sur la visualisation
interactive des données.
La quantité de données disponible fait espérer des
analyses plus fiables et produisant de nouvelles
connaissances. C’est ce qui fait dire à certains
que les données sont "le nouvel or noir", une nou-
velle ressource à exploiter pour en extraire de la
valeur. Mais produire, acheminer, traiter, stocker et
analyser les mégadonnées nécessite de nouvelles
approches mathématiques et informatiques.
De collections d’éléments d’information manipu-
lables sous une forme informatique : de nombres,
de textes, d’images, de sons et de vidéos intégrés
dans des tables ou documents, par exemple.
On parle de mégadonnées (ou de données massives)
quand leur volume ou leur débit est tel qu’elles ne
peuvent être traitées de manière conventionnelle.
Un volume ou un débit importants peuvent résulter
d’une mesure ou d’une simulation très précise,
d’une acquisition en continu ou de l’accumulation
sur de longues périodes, ou de la production en
parallèle par de nombreuses sources.
// Mots cles
7. 07#03 JUIN 2016
Les orpailleurs du big data 08-09
Un projet CPER
dEdiE A la donnee 09-10
Bigrement data chez Inria 11
SOmMAIRE
dossier
Les donnees :
matiÈre premiÈre
et source d'enjeux
pour le numÉrique
8. 08
// dossier > les données
Nous produisons chaque jour
des milliards de données de par
le monde : un flot continu d’in-
formations dématérialisées
qui vaut son pesant d’or. En
2012 ce marché des données
représentait déjà 6,3 milliards
de dollars et pourrait atteindre 48,3
milliards d’ici à 2018*. Chez Inria,
les équipes-projets de recherche se
mobilisent pour trouver comment
créer du sens et de la valeur à partir
de ces données.
Mais que peuvent bien contenir nos
données pour que les entreprises et
les chercheurs se les arrachent à ce
point ? Les spécialistes décrivent le
Big Data comme le nouvel or noir :
parmi ces flots continus d’informa-
tions que nous produisons tous les
jours, se cacherait forcément de la
valeur. De nombreuses entreprises
et startups sont à la recherche des
clés qui leur permettront de créer
du sens et surtout de générer des
revenus à partir de quantités de
données inintelligibles pour un
simple cerveau humain. Un enjeu de
taille qui mobilise les équipes-projets
du centre Inria Lille – Nord Europe
et les conduit à nouer de nombreux
partenariats.
À l’origine du Big Data :
des ordinateurs plus
puissants et des objets
connectés
Le Big Data est un phénomène ré-
cent, issu de la puissance de calcul
des ordinateurs d’aujourd’hui*,
mais surtout de la multiplication
des objets connectés. Une foule de
données sort directement de notre
poche et de nos Smartphones :
en 2015, 58% des Français étaient
équipés d’un de ces appareils. Un
chiffre qui continue de progresser
et qui atteint 90% chez les 18-24
ans. Les données récoltées par le
biais des différents systèmes ou
services proposés par ces équi-
pements sont faramineuses :
géolocalisation, requêtes, mes-
sages, photos et vidéos envoyées
quotidiennement par des mil-
liards d’utilisateurs. Les réseaux
sociaux (Twitter, Facebook etc.)
émettent un flot continu que l’on
compare parfois à des “ fire hose ”
(des lances à incendie), d’où les
datas, jaillissent en très grande
quantité et en flux discontinu. Plus
de 500 millions de tweets sont pu-
bliés tous les jours et 144 milliards
d’emails. Mais ce n’est pas tout :
“ Aujourd’hui, nous sommes en-
tourés de réseaux de capteurs :
pour enregistrer des données cli-
matiques par exemple, ou bien
dans l’industrie, pour gérer des
stocks, ” explique Nicolas Rous-
sel, délégué scientifique du centre
Inria Lille – Nord Europe. Toutes ces
informations peuplent de gigan-
tesque datas centers : des mines
qui valent de l’or, si l’on sait s’y re-
pérer et que l’on met au point des
méthodes pour leur donner du sens.
“ À partir du moment où elles
sont devenues big, les datas ont
intéressé les chercheurs. Mais
le chemin entre les données et la
création de valeur est long et com-
pliqué, ” prévient-il.
Des données pour
prévoir l’avenir
Ce potentiel, beaucoup d’entreprises
l’ont déjà repéré. Sylvain Karpf est
responsable du service transfert
pour l'innovation et partenariats
du centre Inria Lille - Nord Europe.
Il joue un rôle d’intermédiaire entre
les chercheurs et les acteurs écono-
miques de la région. “ Exploiter des
données est un besoin dont les en-
treprises nous font souvent part,
explique-t-il. Ils souhaitent que
nous leur offrions des solutions
pour traiter des gros volumes. ” Le
secteur du commerce est particu-
lièrement demandeur, par exemple
pour réaliser des outils de gestion
des stocks, car une bonne analyse,
réalisée à partir de méthodes de
calcul adaptées, permet de prédire
l’avenir. Ainsi, l’équipe-projet Modal
sous la responsabilité de Christophe
Biernacki, propose une approche
statistique pour le traitement de
données et travaille sur ces sujets
avec l’éditeur de logiciel Cylande.
Dans l’industrie, les acteurs s’inté-
ressent à la maintenance prédictive :
en récoltant de très nombreuses
données sur la chaine de produc-
tion, des algorithmes sont capables
de prévoir une panne suggérant ain-
si de réaliser une opération de main-
tenance. Des équipes de recherche
comme Dolphin et Inocs proposent
quant à elles des méthodes d’op-
timisation s’appliquant à de nom-
breux secteurs.
Visualiser les données
Une startup baptisée Colisweb col-
labore avec des chercheurs d’Inocs
Les orpailleurs
du big data
9. #03 juin 2016 09
pouroptimiserleursystèmedelivrai-
son de colis sur le dernier kilomètre
et générer un modèle économique
rentable. D’autres équipes-projets
du centre Inria Lille – Nord Europe,
comme Sequel ou Magnet, utilisent
le machine learning pour élaborer
des systèmes de recommandation :
des recommandations de produits
dans le commerce ou des conseils
musicaux par exemple. “ Grâce à
nos partenariats avec des entre-
prises, nous disposons de données
réelles pour valider nos travaux de
recherche et les faire progresser, ”
se félicite Sylvain Karpf. En bout de
chaine, vient la visualisation des
données : comment rendre intelli-
gible et compréhensible d’un seul
coup d’œil une masse colossale de
données. C’est ce que réalisent les
chercheurs de l’équipe Mjolnir de
Nicolas Roussel, qui travaillent sur
les interactions homme-machine.
À la recherche du
” quality data “
“ On a tendance à croire que dès
qu’il y a des données en quantité,
il y a de la valeur. Mais il faut être
vigilant quant à leur qualité. La
position indiquée par un Smart-
phone ou un récepteur GPS n’est
pas toujours fiable par exemple.
Comment travailler à partir de da-
tas imparfaites ? ” prévient Nicolas
Roussel. Pour répondre à ce défi,
plusieurs équipes-projets du centre
Inria Lille – Nord Europe sont mo-
bilisées. Fun propose notamment
d’optimiser les réseaux de capteurs
pour les rendre plus fiables, alors
que Modal cherche à élaborer des
modèles statistiques capables de
réaliser des prévisions fiables à par-
tir de données imparfaites, en com-
plétant les trous et corrigeant les
erreurs. Les perspectives et les en-
jeux autour des données sont donc
vastes et particulièrement straté-
giques pour les années à venir. Dans
ce contexte, le centre de recherche
Inria Lille – Nord Europe est por-
teur d’un projet CPER (Contrat Plan
Etat Région) Data pour “ Advanced
data science and technologies ”. Ce
projet ambitionne de mener un pro-
gramme de recherche sur ce sujet
au meilleur niveau international en
synergie forte avec le tissu écono-
mique régional et de mettre en place
les infrastructures de recherche à la
hauteur des enjeux.
Un projet CPER
dédié à la donnée
*D’après le cabinet d’études Transparency Market Research.
*Tianhe-2, l’ordinateur chinois qui détient le record du monde, peut réaliser plus de 33 billiards (33 millions de milliards) d’opérations à la seconde.
Les techniques du nu-
mérique bouleversent
considérablement nos
sociétés et impactent
l’ensemble des activités
humaines. Pour maîtriser
ces transformations, le do-
maine de la recherche joue un rôle
fondamental. Il permet d’adapter
ces nouvelles techniques et
ces nouvelles connaissances
au monde qui nous entoure en
proposant des solutions et des
technologies pour nos sociétés.
Le numérique représente éga-
lement à lui seul un nouveau
secteur économique générateur
d’emplois directs (30 000 emplois
dans le Nord et le Pas-de-Calais)
mais aussi plus indirects dans les
nombreux domaines d’application
pour les industries du numérique.
Dans ce contexte, la donnée et
les technologies numériques clés
associées (Internet des objets,
cloud computing, big data et
calcul intensif) représentent des
enjeux importants. Il s’agit des
principaux axes développés dans
le projet “ Advanced data science
and technologies ” porté par Inria
dans le cadre du contrat de plan
État-Région (CPER) 2015-2020
et qui associe Centrale Lille, le
CNRS, l’École des Mines de Douai,
l’Université d’Artois et l’Université
de Lille. L’objectif est de mener
un programme de recherche, en
synergie avec le tissu économique
régional, et de mettre en place
des infrastructures à la hauteur
des enjeux de cette révolution
numérique.
Leprogrammescientifique
Il s’articule autour de trois do-
maines d’excellence, développés
dans notre région, dans la re-
cherche numérique et concernent
les différentes étapes de la vie
d’une donnée de sa captation à
son exploitation.
L’internet des objets : il s’agit d’un
concept qui représente l’extension
du réseau internet à des objets
10. leur permettant ainsi de commu-
niquer entre eux ou de collecter
des informations. Il implique un
bouleversement en profondeur
de notre quotidien qui va bien
au-delà de la simple utilisation de
nos smartphones.
Les applications, dans le monde
physique environnant, sont très
nombreuses par exemple grâce
à l’utilisation des RFID (Radio
Frequency Identification), une
méthode pour récupérer des
données à distance, ou le dévelop-
pement de réseaux de capteurs.
L’augmentation du nombre
d’objets connectés dans notre
quotidien génère des volumes de
données toujours plus importants.
Intelligence des données et des
connaissances : désormais, les
activités humaines entraînent
des échanges de données aux
volumes gigantesques. Afin de
pouvoir les traiter et en extraire
des informations, il faut être ca-
pable de repousser les limites des
techniques existantes et relever
en permanence des défis liés à la
modélisation des données, à l’ap-
prentissage artificiel, à la fouille
des données, à l’intelligence ar-
tificielle ou encore à l’exploitation
de bases de données. Le domaine
de la recherche doit s’adapter pour
pouvoir gérer des problématiques
de plus en plus complexes et
inventer des systèmes capables
de raisonner en présence de tous
les types de données.
Calcul haute performance et
optimisation : l’exploitation de
données qui peuvent être volumi-
neuses, dynamiques, incertaines
voire incomplètes demande des
capacités de traitement impor-
tantes. Dans le domaine du calcul
haute-performance, la puissance
de calcul développé a considéra-
blement augmenté ces dernières
années. Il faut pouvoir développer
des algorithmes capables de
traiter des volumes importants
de données et d’exploiter les
informations contenues dans les
nuages, tout en relevant le défi de
la maîtrise de la consommation
d’énergie (green computing).
Des infrastructures à
la hauteur des enjeux
Afin de concrétiser les recherches
menées dans le domaine des data,
dans le cadre de ce projet du
CPER, plusieurs plates-formes se-
ront mises en œuvre. La première,
pourvue d’un environnement idéal
avec l’équipement d’excellence
Future Internet of Things (EquipEx
FIT), permettra de mener des
expérimentations dans le do-
maine de l’internet des objets. La
deuxième aura pour vocation de
valider les travaux de recherche
sur le calcul haute-performance
autour de la plate-forme nationale
Grid’5000. Les travaux seront
également valorisés à travers le
développement de logiciels phares
dans les domaines de la collecte et
du traitement des données.
Plusieurs démonstrateurs seront
également réalisés, favorisant
interactions avec le monde so-
cio-économique :
• Un service web d’OpenAPI sera
mis en œuvre pour l’expérimen-
tation à titre d’essai des résultats
de la recherche.
• Un démonstrateur baptisé
“ Mes Infos ” sera développé.
Il s’agit d’une initiative basée
sur le principe d’un coffre-fort
dans lequel le citoyen pourrait
gérer certaines de ses données
personnelles.
• Le démonstrateur “ smartGrid ”
permettra de mettre en œuvre
les techniques de collecte de
données pour la gestion de
réseaux de distribution d’électri-
cité intelligents. Il sera développé
dans le cadre du projet de dé-
monstrateur de ville intelligente
et durable proposé également
dans le cadre du CPER.
Des retombées scien-
tifiques régionales et
internationales
Le sujet des data impliquant des
enjeux importants dans beaucoup
de domaines, la valorisation des
travaux menés dans ce projet
du CPER devrait connaître
un retentissement national et
international fort dans le do-
maine de la recherche. Le projet
prendra aussi une dimension
régionale importante en raison
des nombreuses interactions
avec les pôles d’excellence et
les pôles de compétitivité de la
Région. Au regard du diagnostic
territorial et du schéma régional
de développement économique,
quatre domaines d’application
prioritaires ont été identifiés pour
le transfert et la valorisation de
ces technologies clés liées à
l’exploitation des données :
• Ubiquitaire, smart cities, trans-
port et énergie
• Services à la personne et
commerce
• Culture, loisirs et création
numérique
• Santé et hôpital numérique
Dans la région, des pôles d’excel-
lence comme EuraTechnologies,
Pictanovo, le pôle des industries
du commerce ou encore le
campus-pilote de l’Université de
Lille – Sciences et Technologies
sur les “ smart cities ” par exemple
représentent des atouts pour
l’expérimentation et la valorisation
des actions de recherche de ce
projet. Le programme impliquera
également les entreprises à
travers la mise en place de
laboratoires communs avec des
PMEs afin de favoriser la montée
en puissance de la RD privée.
10
dossier les données
11. 11#03 juin 2016
les données dossier
La plate-forme ouverte Moose, de l’équipe-projet Rmod, permet d’analyser des
logiciels de plus 5 millions de lignes de code et offre plus de 70 métriques. Elle
permet d’analyser plus de 15 langages différents.
L’équipe-projet Fun et la société Traxens proposent d’équiper tous les contai-
ners qui transitent dans le monde d’un capteur sans fil capable de surveiller
l’état de santé et la position du container et de sa marchandise où qu’il soit sur la
planète. Pour le produit de Traxens, chaque capteur remonte entre 1 et 2 kilo oc-
tet de données chaque jour, soit entre 19 et 38 mega octet par bateau et par jour.
La plate-forme logicielle Paprika, développée par l’équipe-projet Spirals, a déjà
pu identifier 7,7 millions d’anti-patrons logiciels en automatisant l’analyse de
291,3 millions d’instructions de 3553 applications mobiles publiées sur le Goo-
gle Play Store. Les anti-patrons sont des erreurs courantes d’implémentation et
de conception des logiciels.
L’équipe Mjolnir a récemment collecté des informations relatives à plus de 82
millions de contacts sur des pavés tactiles (position du doigt, orientation, taille
de la zone de contact). Ces données vont être utilisées pour comprendre l’utilisa-
tion actuelle de ces dispositifs et proposer de nouvelles techniques d’interaction.
En bio-informatique, le volume de données d’ADN généré en routine par le sé-
quençage d’un échantillon environnemental est de 100 gigabases. Ce type
d’échantillon peut être analysé en moins d’une minute par le logiciel SortMeRNA
développé par l’équipe-projet Bonsai.
L’équipe-projet Modal a analysé 2.5 millions de tickets de caisse pour aider la
société Rouge Gorge à mieux comprendre qui sont ses client(e)s.
31,5 millions de mesures ont été utilisées pour créer le modèle d’un écoulement
turbulent par l’équipe-projet Non-A. L’objectif du travail est de réduire les tur-
bulences aérodynamiques pour réduire la consommation des véhicules ou
améliorer la portance des avions. Ces résultats en simulation vont être testés
en soufflerie à l’Onera.
Bigrement data chez Inria
14. 14
Le démonstrateur TAN
installé sur le Plateau Inria
à EuraTechnologies pré-
sente trois exemples de
travaux de Fanny Chevalier
(chercheuse au sein de
l’équipe Inria Mjolnir) dans
le domaine des transitions
animées.
Les transitions animées participent
à la facilité et à la qualité de lecture
dans les interfaces. Concrètement,
il s’agit de ces animations qui per-
mettent de fluidifier le passage
d’une page internet à une autre,
d’identifier où disparaissent les fe-
nêtres de votre bureau quand vous
les minimisez, ou encore de rafrai-
chir progressivement un fil d’actua-
lité en ligne. Ces animations sont
utiles pour véhiculer de manière évi-
dente les informations essentielles
à l’utilisateur d’un système infor-
matique. Si elles sont mal maîtri-
sées, ces transitions animées repré-
sentent des sources de pollutions
visuelles pour les usagers. Pour les
rendre efficace, il est donc essentiel
de réaliser un travail de conception
précis en y intégrant une multitude
de paramètres. Dans le cadre de ses
// focus Interaction homme-machineInteraction
homme-machine
Les transitions
s'animent
15. 15#03 juin 2016
travaux de recherche, Fanny Cheva-
lier, chercheuse au sein de l’équipe
de recherche Mjolnir (commune
avec l’Université de Lille 1), a déve-
loppé des modèles de transitions
animées permettant une meilleure
compréhension des interfaces, et
conçu des outils les utilisant pour
faciliter, par exemple, le travail de
retouche d’image, ou l’édition de do-
cuments.
Histomages : les transi-
tions animées au service
de la retouche numé-
rique
Pour comprendre l’intérêt du dé-
veloppement de cet outil, il faut
tout d’abord comprendre comment
est composé l’histogramme d’une
image. Il s’agit d’un graphique sta-
tistique qui représente le nombre de
pixels et l’intensité des couleurs qui
y sont associées, des notions consi-
dérées comme des indicateurs pou-
vant guider la retouche numérique.
C’est en modifiant cet histogramme
qu’il est possible de corriger les
nuances et l’échelle des couleurs
dans le but de rendre l’image plus
lisible ou plus attractive. Habituel-
lement assez complexe, ce genre
de manipulation devient beaucoup
plus facile. Avec Histomages, l’uti-
lisateur peut sélectionner les pixels
d’une zone précise et ainsi modifier
les caractéristiques colorimétriques
de cette partie de l’image ou de la
photo. L’outil facilite cette démarche
grâce à des transitions animées
qui favorisent la compréhension
du principe de l’histogramme et de
la retouche d’images numériques.
Les pixels de l’image s’animent
pour se “ réorganiser ” en fonction
de leur valeur de couleurs, et former
progressivement l’histogramme. Il
est possible de manipuler la cou-
leur des pixels directement dans
cet histogramme en déplaçant les
pixels dans cet espace de couleurs,
par exemple, en faisant glisser une
sélection de pixels clairs dans l’his-
togramme de luminance, vers une
zone plus foncée. L’utilisateur tra-
vaille à partir de deux représenta-
tions différentes de la même image,
entièrement synchronisées, pour fa-
ciliter les retouches de la photo.
Diffamation : n’oubliez
pas la version originale
Sur un document assez complexe,
le texte ou le code source que nous
rédigeons évoluent au fil du temps
avec des ajouts, des suppressions
ou des corrections. Mais parfois,
il peut être très utile de conserver
une trace des modifications suc-
cessives. Grâce à Diffamation, il
est possible de travailler à partir de
n’importe quelle étape mais aus-
si de comparer plusieurs versions
d’un document depuis sa création
jusqu’au dernier modèle. Afin de
créer une solution la plus complète
possible, Fanny Chevalier a intégré
la notion de transition animée pour
faciliter la lecture d’un document
et pour retrouver la totalité de ses
évolutions. Sous Word par exemple,
un outil de correction permet de vi-
sionner deux représentations com-
binées d’une page avec les ajouts
colorés et les suppressions barrées.
Diffamation va plus loin, notamment
grâce aux principes des transitions
animées. Des animations élaborées
facilitent le passage d’une version
d’un texte à une autre à l'aide d’une
illustration colorée. Vous pouvez na-
viguer au fil d’une sorte de ligne de
vie du texte située en haut de l’écran
qui permet de montrer de manière
intelligible les ajouts, modifications
et suppressions de texte entre la to-
talité des versions d’un document.
Gliimpse : simple comme
un clic
Entre le HTML, le LaTeX ou encore le
wiki, les langages à balise (Markup
Language) sont très nombreux. Les
éditer sur un document final de-
mande habituellement des étapes
de compilations et de chargement
assez fastidieuses et répétitives.
Avec l’outil Gliimpse, il est pos-
sible de basculer instantanément
du code source au résultat final et
inversement en un seul clic. Dans
le langage HTML, le plus connu
d’entre eux, les balises indiquent par
exemple à l’intérieur d’un fichier les
éléments de mise en page tels que
les titres, les paragraphes ou encore
les polices. Pour éditer ce langage
sur une page web, comme pour le
wiki ou le LateX (souvent utilisé par
les scientifiques) il faut utiliser un
logiciel spécifique qui implique de
nombreuses manipulations. L’outil
Gliimpse vient améliorer et faciliter
les modes d’édition. Des animations
sophistiquées, permettent de com-
prendre le lien entre le texte brut
du code et les textes formatés en
images et autres éléments visuels
qu’il produit. Les transitions ani-
mées sont optimisées pour visua-
liser sans effort la représentation
mise en forme d’un document défini
par balises.
º tan.lille.inria.fr
º mjolnir.lille.inria.fr
16. 16
Le marché du recrutement
se digitalise fortement. Les
réseaux sociaux profession-
nels (LinkedIn, Viadeo,...)
représentent des vecteurs de
communication et de prospec-
tion efficaces sur le marché du
travail. Ils favorisent les recru-
tements et facilitent les recherches
de nouveaux partenaires profession-
nels. Cependant, d’après la dernière
enquête de l’Apec, le réseau continue
à jouer un rôle essentiel puisque
39% des entreprises ont recours à la
cooptation des salariés pour trouver
des candidats. Keycoopt propose de
rendre plus efficace les recrutements
en associant les deux tendances.
La jeune start-up lilloise a lancé une
plate-forme d’“ e-cooptation ”. Le
principe est de relayer les annonces
d’entreprises à un réseau d’experts
métiers en fonction de leur localisa-
tion et de leur profil. Ils sont ensuite
chargés d’activer leur réseau de
connaissances afin de recomman-
der le candidat qui répond le mieux
aux attentes du recruteur. Grâce à
Keycoopt, les entreprises atteignent
des collaborateurs potentiels qu’elles
n’auraient pas identifiés via des outils
classiques.
Un algorithme pour op-
timiser la sélection des
coopteurs
Afin d’accélérer son développe-
ment, Keycoopt a signé en mai
2015, un contrat de collaboration
avec l’équipe de recherche Magnet
du centre Inria Lille - Nord Europe
(commune avec l’Université Lille 3),
spécialisée dans la définition de mé-
thodes et de modèles de “ machine
learning ”, ou encore “ apprentissage
artificiel ”, au sein de réseaux d’in-
formations. L’objectif de ce parte-
nariat est d’automatiser le système
de sélection des coopteurs, effectué
jusqu’à présent de façon “ manuelle ”
par les collaborateurs de Keycoopt.
L’équipe de recherche a travaillé
pour proposer un logiciel qui favo-
rise le “ matching ” entre les don-
nées non textuelles des annonces
(catégories, secteurs, services,
zones géographiques, métiers…) et
les profils des coopteurs pour sélec-
tionner ceux qui sont susceptibles
de proposer les candidats les plus
pertinents.
Le “ machine learning ”
au service du “ crowd re-
cruiting ”
Sur le modèle du financement par-
ticipatif (crowdfunding), beaucoup
d’entreprises font désormais appel
au principe du “ crowd recruiting ”.
Preuve de son efficacité, quelques
grands noms comme L’Oréal, Orange
ou Cartier ont été séduits par la so-
lution de recrutement proposée par
Keycoopt. Le nouveau logiciel fait
intervenir le principe du “ machine
learning ” qui permet d’obtenir une
analyse prédictive à partir d’un
grand nombre de données. “ Les
prédictions sont plus pertinentes,
elles correspondent davantage à la
réalité. ”, souligne François Noyez,
ingénieur dédié au transfert de
technologie au sein du programme
InriaTech. Livré en décembre 2015, le
logiciel d’apprentissage automatique
conçu pour Keycoopt pourrait être
encore enrichi grâce à des parte-
nariats dans les mois à venir. De
nouvelles recherches pourraient
encore affiner la pertinence des
recommandations automatiques,
par exemple en exploitant encore
plus de données textuelles des
coopteurs et des annonces. “ Il ne
faut pas exploiter uniquement
le fait de savoir si la personne a
Keycoopt et Inria
réinventent le recrutement
par cooptation
// focus Machine Learning
Permettre aux entreprises de recruter des cadres par cooptation : c’est le concept de Keycoopt.
Née en 2012, cette start-up lilloise a fait appel au savoir-faire d’Inria pour concevoir un outil logiciel
afin d’automatiser et de renforcer la pertinence de cette méthode de recrutement.
MachineLearning
17. 17#03 juin 2016
finalement été embauchée ou non,
mais également les raisons plus
précises de cette décision, par le
biais de commentaires formulés par
les coopteurs et les consultants de
Keycoopt. ”, ajoute Rémi Gilleron,
chercheur au sein de Magnet. La
plate-forme devrait permettre aux
coopteurs de recevoir des annonces
toujours plus en adéquation avec leur
réseau professionnel et à Keycoopt
de réduire la durée de la recherche
des candidats.
Machine learning :
le recruteur de demain ?
Le machine learning au service
de la recommandation constitue
une problématique de recherche et
de développement nouvelle pour
Inria, qui bénéficie des compé-
tences technologiques apportées
par le récent dispositif InriaTech.
“ Scientifiquement, ce projet de
recherche et développement nous
donne l’opportunité d’explorer des
méthodes nouvelles d’analyse
de texte et de réseau ”, se réjouit
Rémi Gilleron. Keycoopt, qui se
positionne comme le TripAdvisor
du recrutement, relève un nouveau
défi qui s’inscrit dans la lignée des
nouvelles entreprises de l’économie
collaborative. “ Pour l’instant, il
s’agit de remplacer le modèle du
chasseur de tête par des méthodes
collaboratives, pour lesquelles
l'apprentissage automatique peut
aider à recommander, suggérer et
choisir dans des espaces de solu-
tions très grands ”, souligne Rémi
Gilleron. “ Le but ici est d’émettre
des propositions soumises à la va-
lidation d’un expert métier. De mon
point de vue, si la machine peut
proposer des profils, la décision
de recrutement reste de l'ordre de
l'humain ”, conclut François Noyez.
º team.inria.fr/magnet
º keycoopt.com
18. 18
// best-of
Inria en pleine
expansion à Lille
Au cœur de l’écosystème de la French
Tech, Inria a fait l'acquisition d’un
troisième bâtiment lillois localisé à
EuraTechnologies, afin de développer
son activité de recherche au service
du transfert et de l’innovation. Le
bâtiment, dont l’ouverture est prévue
en 2018, accueillera des équipes de
recherche centralisées sur le logiciel
libre et les data.
Un MOOC sur le langage
de programmation Pharo
L’équipe-projet Rmod a participé à la
conception d’un MOOC sur le langage
de programmation objet Pharo, dif-
fusé sur la plate-forme FUN (France
Université Numérique), de mai à juin.
Plus de 2 750 personnes inscrites se
sontforméesenligneàcetteoccasion.
Deux chaires
Internationales
Inria souhaite encourager les séjours
longs de chercheurs internationaux
éminents dans ses équipes et leur
donner une plus grande visibilité,
en définissant un programme de
Chaires Internationales d’une durée
de 12 mois répartis sur 5 ans. Le
centre de recherche Inria Lille – Nord
Europe accueille fièrement Marcelo M.
Wanderley, professeur à l’Université de
McGill (Canada) spécialisé en tech-
nologie de la musique et Interaction
Homme-Machine au sein de l’équipe
Mjolnir, et Miguel F. Anjos, professeur
à l’École Polytechnique de Montréal
(Canada), spécialisé dans l’application
de l’optimisation dans les smart grids,
au sein de l’équipe Inocs.
Signatures
accord - cadre
Le 3 mai dernier, l'Institut
Pasteur de Lille et Inria ont
signé un accord-cadre de par-
tenariat transdisciplinaire sur
les sciences du numérique et
la santé.
Le 19 mai, l’Université de Lille -
SciencesetTechnologiesetInria
ont renouvelé leur partenariat
scientifique en signant un ac-
cord-cadre. Ce dernier officialise
leur collaboration de longue date
dans le domaine des sciences
du numérique.
Ilnefallaitpasmanquer... Partenariats
Photo
Pour cette deuxième saison, R2D2 aime Inria Lille.
Faites comme lui, dégainez votre badge et dites
le sur Twitter avec le hashtag #ILoveInriaLille ou
envoyez vos photos à º com-lille@inria.fr
21. 21#03 juin 2016
Avec Christian Duriez, les
robots deviennent plus vrais
que nature. Ce chercheur
Inria, responsable de l’équipe
Defrost, est à la fois entouré de
spécialistes de l’électronique, de
la simulation numérique, d’ingé-
nieurs ou de créateurs de logiciels
mais aussi de drôles de machines
molles constituées de silicone ou
de polymères élastiques. Sur les
bureaux, ces prototypes de robots
déformables sont soumis à rude
épreuve pour tester leur résistance.
Pour mieux connaître la matière
qui les compose, ils sont étirés ou
tractés par des câbles à longueur
de journée. “ Notre objectif est par
exemple de piloter la déformation
du robot en calculant les charges
qu’on lui applique. Nous utilisons
l’impression 3D pour fabriquer des
robots, afin de pouvoir valider nos
modèles et vérifier qu’ils ne sont
pas trop éloignés de la réalité ”.
Avec son équipe pluridisciplinaire,
Christian Duriez travaille sur des
robots qui dans le futur seront sans
doute capables d’intervenir dans
des domaines encore insoupçonnés
aujourd’hui. Après avoir travaillé 10
ans sur la simulation chirurgicale,
notamment sur le comportement
mécanique des tissus anatomiques
et leurs interactions avec les outils
du chirurgien, il a choisi de faire
un changement de cap dans sa
recherche. “ Pour ce nouveau
sujet, nous pouvons profiter de
notre savoir faire sur la simulation
temps-réel des corps déformables
mais aussi envisager des appli-
cations nouvelles en robotique
chirurgicale ”.
Modéliser un robot sur
logiciel
Cette nouvelle façon de concevoir
les robots pourrait révolutionner le
secteur dans les prochaines années.
“ L’industrie reproche régulièrement
aux robots d’être dangereux. Les
modèles déformables le sont beau-
coup moins. Ils peuvent s’adresser
à des segments qui recherchent des
robots moins chers à fabriquer, avec
beaucoup de liberté de mouvement
et capables de se faufiler dans des
endroits très tortueux ”.
Les robots déformables offrent
donc de nouvelles perspectives aux
industriels pour l’avenir et l’équipe
Defrost poursuit ses recherches
pour les modéliser et les piloter
avec le plus de précision possible.
“ Nous sommes la seule équipe au
monde pour l’instant à pouvoir mo-
déliser un robot sur logiciel. Nous
aimerions que notre plate-forme
devienne standard. Il faut pouvoir
analyser un nombre de variables
infiniment plus important que pour
un robot rigide ”.
Des robots incassables
Alors que la recherche dans le
domaine n’en est encore qu’à ses
balbutiements, certains industriels
commencent déjà à prendre
conscience du potentiel et des
qualités du robot déformable. “ Il
peut amortir la plupart des chocs.
Fabriqué en silicone, il est incas-
sable même dans les milieux les
plus hostiles. Alors qu’un robot
rigide est capable d’éviter les col-
lisions, le robot déformable utilise
les contacts avec l’environnement
pour avancer, c’est une conception
complètement différente ”.
Lors de la récente bourse aux
technologies organisée à Paris,
un évènement qui favorise les
rencontres entre les chercheurs et
le monde industriel, un prototype
a été présenté par l’équipe Defrost.
“ L’objectif était de concevoir un
robot qui parle aux industriels pour
commencer à réfléchir ensemble.
Nous souhaitons pouvoir travailler
sur des projets de recherche
communs avec des entreprises qui
pensent déjà à demain ”, conclut
Christian Duriez.
portrait
Repousser les limites
de la robotique Christian Duriez
22. 22
// rendez-vous
RDV du
Plateau
Chaque mois, de 9h à 10h30
ne manquez pas Les Rendez-
vous du Plateau organisés
sur le Plateau Inria situé à
EuraTechnologies. Une équipe
de recherche Inria vient à la
rencontre des entreprises locales
afin de soutenir le transfert de
technologies vers l’écosystème
régional. Au programme de ces
rencontres : cloud computing,
big data, interactions homme-
machine, génie logiciel, machine
learning… autant de sujets de
recherche pointus qui vous
seront exposés.
Conférence de robotique
“ À la recherche de la
performance industrielle
et sociale ”
Jeudi 7 juillet 2016, salle de conférence, EuraTechnologies
50
Jeudi 20 octobre 2016,
Centre Inria Lille – Nord Europe
Àl'aubedes50ansd'Inria,lecentre
Inria Lille - Nord Europe vous
invite jeudi 20 octobre à partir de
17h00 à célébrer le recrutement
du cinquantième chercheur Inria
à Lille qui sera l’occasion de faire
un tour d’horizon de près de 15
ans d’innovations, d’avancées
technologiques et de travaux de
recherche dans les sciences du
numérique au sein de l’Eurorégion.
Rencontres Inria – Industrie
“ Interaction avec les objets
et services numériques ”
Vendredi 25 novembre 2016, Imaginarium de Tourcoing
Retrouvez ces évènements
et bien d’autres dans l’agenda du centre !
º inria.fr/lille
À l’ère des nouvelles technologies, les
robots s’immiscent dans notre quo-
tidien et transforment les systèmes
de production des PMEs et des
grands groupes. Considérée comme
une solution de performance et de
compétitivité pour l’industrie, la robo-
tisation soulève encore beaucoup de
questions en termes d’intégration,
de coût, de rentabilité et d’éthique.
Des défis scientifiques et technolo-
giques sont également au cœur de
la robotique.
Venez rencontrer les acteurs de la
région qui s’intéressent à ces pro-
blématiques, des entreprises qui
partageront leur expérience d’inté-
gration de robots industriels dans leur
activité, des chercheurs spécialisés
en robotique qui vous présenteront
les dernières avancées technolo-
giques en la matière. Au programme :
conférences et démonstrateurs !
Depuis une vingtaine d’années Inria
organisedesRencontresInriaIndustrie
pendant lesquelles l'institut présente
son offre de recherche et de trans-
fert à destination des entreprises d’un
secteur donné. Les objectifs de ces
journées est de faire connaître les tra-
vaux d'Inria et de mieux comprendre
les besoins des industriels pour établir
des liens entre les deux communautés
qui pourront déboucher sur des pro-
jets de collaboration et de transfert de
technologies. La journée est articulée
autourdedémonstrationss’appliquant
au secteur considéré, réalisées par des
équipes Inria et des PME issues/par-
tenaires d’Inria, et complétée par des
conférences thématiques.
Cet événement est organisé en par-
tenariat avec la Plaine Images dans le
cadre de la semaine de la Recherche
etdel’InnovationdesHauts-de-France
º interaction.lille.inria.fr/rii
23. 23#03 JUIN 2016
Parc scientifique de la Haute Borne
40, avenue Halley
Bât A - Park Plaza
59650 Villeneuve d’Ascq
France
(+33) 03 59 57 78 00
(+33) 03 59 57 78 50
º inria.fr/lille
º contact-lille@inria.fr
@Inria_Lille
Découvrez les coulisses du centre
au travers de notre Tumblr Between Us !
º inrialille.tumblr.com
// Centre de recherche
Inria Lille - Nord Europe
// Plateau Inria, Euratechnologies
Inria est présent au sein de l’écosystème EuraTechnologies d’innovation en TIC
par un plateau de 200 m² unique en son genre. Il présente les travaux des équipes
d’Inria. L’objectif est de favoriser les interactions entre la communauté scientifique,
le monde économique et la société. Ainsi, un espace de travail collaboratif a été
mis à disposition de l’ensemble des acteurs et un programme d’animation est mis
en place tout au long de l’année.
Suivez les activités du Plateau sur Twitter @Plateau_Inria
contact
24. Interaction
avec les objets et services numériques
en partenariat avec la Plaine Images et organisé
dans le cadre de la semaine de la Recherche
et de l’Innovation des Hauts-de-France
Imaginarium, à Tourcoing
+ d’infos : interaction.lille.inria.fr/rii/
vendredi 25 novembre 2016