Programme

Le programme de l’édition 2019 du congrès de la SIF  est centré sur les données : données personnelles et respect de la vie privée, données industrielles.
Les données sont un des quatre piliers de la science informatique, et le congrès de cette année offre un ensemble de conférences pour aborder plusieurs thématiques autour des données.
Les données personnelles sont traitées en tant que tel mais aussi à travers les domaines applicatifs comme la santé et le monde de l’enseignement avec les données pédagogiques.
Les aspects légaux, la RGPD et la sécurité sont aussi au rendez-vous, ainsi que les données industrielles qui sont la valeur du monde numérique.

La journée du jeudi 7 février a été en partie consacrée aux activités de la SIF : AG, élections, remise des prix et accueil des nouveaux membres d’honneur.

Journée du 6 février 2019

8h30-9h Accueil Café

9h Ouverture

  • Marc Phalipou, Directeur général de Bordeaux INP
  • Pierre Paradinas, Président de la SIF

9h30-11h Données industrielles et personnelles

  • Serge Abiteboul (INRIA, ARCEP) : Terra data, terre de diversité
    • On a beaucoup parlé en 2018 de données personnelles avec le RGPD. De telles données, mettant en jeu, le plus souvent, plusieurs personnes, ou étant agrégées, ne sont-elles pas par nature, sociale ? Elles peuvent servir à tellement de choses quand elles sont ouvertes, d’intérêt collectif, collectées par des entreprises, ou anonymisées… à condition de respecter les nouvelles règles du jeu.

  • Tristan Nitot (Qwant) : Services en ligne : comment concilier vie privée et personnalisation
    • Les services en ligne les plus populaires actuellement reposent sur la collecte maximale de données personnelles mettant ainsi à mal la vie privée des utilisateurs, suivant une démarche qualifiée de « capitalisme de surveillance ». Pour éviter cela, des services en « privacy by design » sont créés, mais ne collectant pas de données personnelles, ils ne peuvent offrir des services personnalisés. Dans cette présentation, nous étudieront comment Qwant utilise logiciel libre et cryptographie pour offrir un service à la fois personnalisé et respectueux de la vie privée de ses utilisateurs.

  • Anne Sophie Taillandier (TeraLab) : TeraLab : Accélérateur d’innovation et de recherche en Data et IA
    • La plateforme TeraLab de l’IMT propose une infrastructure à l’état de l’art, sécurisé, à des entreprises ou des opérateurs publics qui peuvent y injecter de grandes quantités de données et lancer des expérimentations avec un écosystème d’entreprises innovantes et/ou de chercheurs. Cela permet aux fournisseurs d’envisager un passage en production très vite car ils sont en mesure d’expérimenter et de tester leurs algorithmes sur des données réelles, que ce soit sur des sujets de logistique, de manufacturing, de santé, de mobilité. Les méthodes d’IA – Big Data (machine learning et deep learning) sont évidemment des technologies envisagées très rapidement. Mais si nous voulons permettre à ces nouveaux produits et services d’être mis en place dans des industries, nous devons aussi regarder des technologies de cybersécurité et de mise en conformité de données. L’échange  sécurisé de données industrielles fait aussi parti des pistes de recherche et d’innovation pour préparer ce marché encore émergent mais qui deviendra sans doute crucial.

11h-11h15 Pause Café

11h15-12h10 Données scolaires et enseignement aux problématiques des données personnelles

  • Carina Chatain, Responsable de l’éducation au numérique (CNIL) : Actions menées par la CNIL en matière d’éducation au numérique.
    • C’est une priorité stratégique de l’institution depuis 2013.  Comme le précise le Règlement européen sur la protection des données personnelles (RGPD), la CNIL a pour mission de favoriser « la sensibilisation du public et sa compréhension des risques, des règles, des garanties et des droits relatifs au traitement. Les activités spécifiquement destinées aux enfants font l’objet d’une attention particulière » (art. 57.1.b).
      Après un bref rappel des grands principes du RGPD (ce qui change avec le RGPD, les outils mis à disposition par la CNIL…) les actions au plan national (ressources pédagogiques, partenariat avec le ministère de l’Education nationale et de la Jeunesse, formations de formateurs, collectif EDUCNUM…) et international (résolutions, plateforme de contenus…) seront détaillées.

  • Jean-Marc Merriaux, Directeur du numérique pour l’éducation (MEN) : Stratégie autour de la protection et la valorisation des données scolaires
    • L’Éducation Nationale produit aujourd’hui un très grand nombre de données liées à la vie scolaire, aux évaluations et aux résultats des élèves, aux travaux et aux devoirs qu’ils réalisent. Une grande variété de données numériques personnelles sont ainsi collectées, stockées et font l’objet de traitements par une multitude d’acteurs (écoles et établissements scolaires, services académiques, collectivités territoriales, partenaires privés fournissant des ressources pédagogiques et services numériques). Le ministère de l’Éducation nationale doit impérativement s’assurer que les flux, les traitements et l’hébergement de ces données scolaires respectent strictement la vie privée des élèves et de leur famille, des professeurs et des personnels administratifs. La conformité de tous les acteurs aux règles encadrant l’usage de ces données constitue l’une des conditions essentielles de la confiance qui doit prévaloir au sein de chaque communauté éducative. Ce dispositif de garanties constitue le préalable indispensable au déploiement de nouvelles opportunités dans le domaine pédagogique à l’entrée de l’École dans l’ère du big data. Mieux protéger pour mieux valoriser constitue la pierre angulaire de la stratégie ministérielle en matière de données numériques.

12h10-12h40 Intervention de Edouard Geffray (DGRH du Ministère de l’Éducation Nationale et de la Jeunesse) à l’occasion de la création du CAPES Informatique.

    • Échanges avec la salle animés par Christine Froidevaux et Gille Dowek.

12h40-14h30 Repas à la Passerelle

14h30-16h30 Aspects juridiques, RGPD et technologies d’anonymisation

    • François Pellegrini (Université de Bordeaux – LaBRI) : Les données de la recherche : entre RGPD et anonymisation
      • Les lois « Informatique et Libertés » nationales, et maintenant le Règlement Général sur la protection des données (RGPD) européen, organisent la protection des données à caractère personnel, c’est-à-dire des données relatives à une personne physique identifiée ou identifiable. Dès le moment où les données sont anonymes ou anonymisées, elles sortent de ce cadre. Pour autant, l’anonymisation est difficile à obtenir, et la « simple » pseudonymisation ne suffit pas à s’exonérer des obligations issues du RGPD. Comment minimiser les risques pour les personnes et les responsables de traitement, tout en ne portant pas atteinte à la qualité des données ?
    • Charlotte Barraco-David (Latournerie Wolfrom Avocats) : A quoi la véritable anonymisation de données à caractère personnel permet-elle d’échapper ?
      • Tant que des données ne sont pas irréversiblement anonymisées, les principes du RGPD imposent à celui qui souhaite les utiliser le respect d’un certain nombre d’obligations perçues comme des contraintes fortes : intégration de principes (tels que minimisation, nécessité de disposer d’un fondement juridique valide, respect des droits des personnes concernées…) dans un véritable programme de conformité (documentation des usages des données, le cas échéant, réalisation d’analyses d’impact sur la vie privée, notification des failles de sécurité…). D’où l’intérêt, lorsque cela est possible, de passer d’une simple pseudonymisation (les données restent des données à caractère personnel) à une véritable anonymisation (les données ne sont plus des données à caractère personnel).

    • Amandine Jambert (CNIL) : Présentation de la doctrine technique de la CNIL concernant l’anonymisation
      • Les questions liées à l’anonymisation des données à caractère personnel ont une importance particulière dans le cadre de la législation en matière de protection des données. Dans ce cadre, il est donc nécessaire de présenter ce que signifie « anonyme » pour les autorités de protection des données européennes. L’avis du G29 (aujourd’hui EDPB) sur les techniques d’anonymisation sera présenté, en insistant sur les moyens de démonstration de l’anonymat d’un jeu de données.
    • Olivier Grall, Délégué régional à la Sécurité Numérique – Nouvelle Aquitaine (ANSII) : État et conséquences de la menace Cyber
      • Le délégué à la sécurité numérique pour la région Nouvelle Aquitaine présentera les principales missions de l’ANSSI. Il fera un état des lieux de la menace en France et des conséquences des attaques cyber au regard du RGPD.

  • Table ronde animée par Fabien Cauchi, représentant du Syntec Numérique

16h30-17h Pause Café

17h-18h

19h30 Apéritif puis repas de gala au Musée d’Art Contemporain de Bordeaux

Anciennement appelé Centre d’Arts Plastiques Contemporains – CAPC. Voir la page évènement.

Journée du 7 février 2019

8h30-9h Accueil Café

9h-10h30 Assemblée générale et élections

10h30-11h Pause Café

11h-12h30 Données médicales

    • Pierre Zweigenbaum (LIMSI – CNRS) : Les données médicales dans les textes
      • Une partie importante des données et connaissances médicales est enregistrée et transmise sous forme de texte. L’obtention de ces données repose sur des méthodes de traitement automatique des langues. La mise au point de ces méthodes requiert des corpus de développement dont la constitution et le partage sont contraints par les impératifs de confidentialité des données médicales personnelles. Cela motive des travaux spécifiques sur la désidentification de ces textes et plus largement sur la conception d’autres méthodes de création de corpus de travail non confidentiels. Cela amène aussi à examiner la question du partage des modèles appris sur des textes à caractère confidentiel.

  • Marc Cuggia (LTSI – Inserm – Université de Rennes 1, Centre des données cliniques du CHU de Rennes) : Le Health Data Hub : un instrument de partage des données de santé et d’innovation
    • Les données massives en santé et l’intelligence artificielle représentent aujourd’hui un enjeu majeur pour l’innovation médicale. Ce bien collectif doit être mis au service du plus grand nombre et exploité dans le respect de la confidentialité, des règles éthiques et au bénéfice des usagers. Pour répondre à ces ambitions, la France met en œuvre des moyens techniques, juridiques et organisationnels sans précédents pour créer le Health Data Hub, un dispositif dont l’objectif et de promouvoir le partage des données de santé et leurs valorisations.

  • Brigitte Séroussi (Sorbonne Université – LIMICS UMR_S 1142 – Assistance Publique – Hôpitaux de Paris) : Le Dossier Médical Partagé : un passé chaotique, un présent prometteur, un futur à assurer
      • Le « dossier médical personnel » (DMP) a été lancé par la loi du 13 août 2004 relative à l’assurance maladie. Il a fait l’objet de plusieurs déploiements infructueux entre 2004 et 2015. En 2016, la loi de Modernisation de notre Système de Santé (re)-relance le DMP (devenu « partagé ») et transfère sa gestion à la Caisse Nationale de l’Assurance Maladie des Travailleurs Salariés. Le DMP est alors décrit comme « un dossier médical numérique destiné à favoriser la prévention, la qualité, la continuité et la prise en charge coordonnée des soins des patients ». Quelques mois après le lancement officiel de sa généralisation sur tout le territoire national en novembre 2018, le DMP a-t-il les atouts pour devenir « une évidence pour tous les français » comme l’a déclaré Agnès Buzyn ?

12h30-14h30 Repas à la Passerelle

14h30-15h30 Prix Gilles Kahn, parrainé par l’Académie des sciences