Rejoignez-Nous sur

Ce que la confidentialité des données signifie pour l’avenir de Blockchain

News

Ce que la confidentialité des données signifie pour l’avenir de Blockchain

Data Analytics et Blockchain

L'analyse des données et l'apprentissage automatique sont extrêmement précieux, car ils fournissent des informations et stimulent les progrès dans de nombreux secteurs, notamment l'IdO, les soins de santé et les services financiers.

Les plates-formes blockchain actuelles ne peuvent pas prendre en charge directement les applications qui calculent des données sensibles.

Malheureusement, les données qui alimentent ces avancées sont souvent extrêmement sensibles. Par exemple, la recherche médicale nécessite un accès aux données sensibles des patients. Dans de nombreux cas, ces données ne peuvent être ni consultées ni partagées pour des raisons de confidentialité. Il en résulte des silos de données dans lesquels les données ne sont pas utilisées pour leur valeur potentielle totale.

La Blockchain peut aider à résoudre ce problème, même si plusieurs problèmes subsistent. Par exemple, on souhaiterait utiliser des contrats intelligents pour permettre aux chercheurs d'effectuer un apprentissage automatique sur des données sensibles sans révéler les données aux chercheurs. C’est la prémisse de nombreuses nouvelles applications de blockchain, notamment les marchés de données et les hedge funds décentralisés.

Malheureusement, les plates-formes blockchain actuelles ne peuvent pas prendre en charge directement les applications qui calculent des données sensibles. Comme nous en avons discuté dans un précédent blog, les blockchains existantes telles que Ethereum stockent publiquement toutes les données et tous les états, ce qui pourrait permettre à tout utilisateur du réseau de voler les données.

La plate-forme Oasis assure la confidentialité de l'exécution des contrats intelligents grâce à l'utilisation de enclaves sécurisées et techniques cryptographiques. En bref, la confidentialité garantit que les données sensibles ne peuvent pas être visualisées ou volées lorsqu'un contrat intelligent est exécuté sur les données.

La confidentialité est une condition essentielle à la protection de la vie privée, absente des plateformes de contrats intelligents d’aujourd’hui. Cependant, la protection du processus de calcul à elle seule ne suffit pas: il faut veiller à ce que le les sorties des calculs ne laisse pas échapper des informations sensibles.

Risques pour la confidentialité de l'analyse de données

Les résultats de l'analyse des données et de l'apprentissage automatique révèlent souvent plus que prévu, ce qui peut conduire à des violations de la vie privée. Par exemple, considérons une entreprise qui publie le salaire moyen de ses employés chaque mois.

Salaire moyen mensuel
Janvier 73 568 $
Février 74 872 $

Notre intuition pourrait nous dire que des résultats statistiques tels que des moyennes ne révèlent aucune information sur des individus. Ceci est une erreur. Imaginez que vous savez que la société comptait 58 employés en janvier et que le seul changement de personnel entre janvier et février a été l’embauche de votre ami Bob. Sur la base des informations combinées, nous pouvons déterminer le salaire exact de Bob: 150 504 $.

Cet exemple simple illustre un problème inhérent à toute requête statistique sur des données sensibles: les résultats de telles requêtes peuvent souvent révéler des informations sensibles, même si ces informations ne sont pas incluses directement dans le résultat (tel que le salaire de Bob). Cela peut arriver accidentellement, souvent de manière non intuitive, et il n’est pas nécessaire que le chercheur cherche intentionnellement à obtenir des informations privées.

Des travaux récents ont montré que les modèles d’apprentissage automatique peuvent également laisser échapper des informations. Par exemple, un article récent co-écrit par des membres de l'équipe Oasis montre comment des informations privées telles que les numéros de carte de crédit peuvent être extraites d'un modèle d'apprentissage approfondi formé à partir de données utilisateur. Plus inquiétant encore, ces fuites se produisent dans de nombreux types de modèles, de paramètres et de stratégies d’entraînement.

L'anonymisation n'est pas une solution

L’approche la plus courante pour protéger la vie privée des personnes consiste à: anonymiser données avant de le relâcher. Cette approche repose sur l'hypothèse selon laquelle si les données ne contiennent aucune information d'identification concernant des personnes (noms, adresses, etc.), elles devraient pouvoir être diffusées sans danger.

Les approches traditionnelles de protection de la vie privée sont insuffisantes.

Malheureusement, les individus peuvent souvent être identifiés dans des ensembles de données anonymisés à l'aide de ce que l'on appelle attaques de ré-identification. Par exemple, Netflix a publié en 2009 un jeu de données de critiques de films anonymes pour un concours destiné à former de meilleurs algorithmes de recommandation. Des chercheurs démontré comment relier les critiques anonymisées aux données de la base de données Internet Movie et être en mesure de ré-identifier un grand nombre de clients Netflix. Sur la base de ce résultat, la FTC a empêché Netflix de lancer un deuxième tour de la compétition.

Il existe de nombreux autres exemples de données anonymisées utilisées pour identifier des personnes spécifiques, notamment: journaux de recherche et voyages en taxi. En fait, un étude récente constaté que 87 pour cent de la population aux États-Unis peut être uniquement identifiés uniquement par leur code postal, leur sexe et leur date de naissance.

Ces résultats suggèrent que les approches traditionnelles de protection de la vie privée sont insuffisantes. Nous avons besoin d'une approche fondamentalement nouvelle qui résiste à ces attaques et à d'autres.

Confidentialité différentielle: Une garantie de confidentialité formelle

Confidentialité différentielle est une définition formelle de la vie privée. De manière informelle, il est indiqué que le résultat d'un calcul doit être similaire, qu'un individu soit inclus ou non dans l'analyse. En d’autres termes, la confidentialité différentielle garantit que, si l’on regarde le résultat obtenu, aucun moyen de dire avec certitude si une personne apparaît dans les données – beaucoup moins pour apprendre leurs informations réelles.

La confidentialité différentielle a plusieurs propriétés souhaitables. Tout d’abord, il n’émet aucune hypothèse quant aux informations auxiliaires disponibles. Il est donc à l’abri de toutes les attaques mentionnées ci-dessus. De plus, bien que la définition empêche d’apprendre des informations sur les individus, elle permet néanmoins d’apprendre beaucoup de choses sur les populations dans les données, ce qui est le but même de la plupart des problèmes d’analyse de données et d’apprentissage automatique.

Malheureusement, la confidentialité différentielle est simplement une définition de quoi la vie privée signifie; ça ne nous dit pas Comment pour atteindre cette propriété. Au cours des dernières années, l’un des principaux objectifs de notre recherche a été de développer des algorithmes et des outils pour appliquer la confidentialité différentielle (et d’autres techniques de préservation de la confidentialité) à des problèmes concrets tels que l’analyse de données et l’apprentissage automatique.

Dans les travaux précédents, nous avons développé Refrain, un framework modulaire pour l’analyse de données préservant la confidentialité. Chorus applique automatiquement la confidentialité différentielle pour l'analyse de données à usage général via plusieurs algorithmes de pointe. Chorus a été publié en open-source et est actuellement déployé à Uber fournir des analyses préservant la confidentialité à ses analystes. En outre, nous menons un projet pilote avec des analystes de données du groupe Winton, qui utilise Chorus pour: prédire les tendances du marché de l'emplacement et des données d'achat tout en protégeant la vie privée.

Nos recherches ont également porté sur l’apprentissage automatique préservant la confidentialité, où nos travaux ont abouti à de nouvelles solutions pratiques permettant de renforcer la confidentialité des tâches d’apprentissage automatique. Nous allons présenter une de ces techniques, Perturbation approximative des minima, à IEEE Security & Privacy 2019, une conférence sur la sécurité maximale.

Nous partagerons plus de détails techniques sur ce travail dans un prochain article de blog.

Primitives de confidentialité pour les contrats intelligents dans Oasis

Chez Oasis Labs, nous construisons une nouvelle plate-forme pour le cloud computing, premier système informatique basé sur la confidentialité et basé sur la blockchain. Notre mission est de définir la nouvelle ère de l'informatique sécurisée et de créer une nouvelle vague d'applications dédiées à la protection de la vie privée. Cela nécessite une solution complète: en plus d'assurer la confidentialité des données au niveau de la plate-forme, Oasis fournira des primitives de confidentialité intégrées au niveau de l'application.

Nous développons actuellement un ensemble de bibliothèques pour permettre aux développeurs de créer des contrats intelligents avant tout en matière de confidentialité, y compris l'analyse de données et l'apprentissage automatique. Ces bibliothèques reposent sur notre vaste expérience dans ce domaine et incluront les techniques de préservation de la confidentialité décrites ci-dessus, ainsi que de nombreuses nouvelles techniques.

Les bibliothèques fourniront aux développeurs une série de blocs de construction préservant la confidentialité, tels que la confidentialité différentielle. Les développeurs peuvent utiliser ces éléments pour élaborer des contrats intelligents qui préservent la confidentialité dès la conception, sans que le développeur soit un expert en sécurité. Il est ainsi facile d’écrire des applications qui accèdent de manière sécurisée aux données sensibles, tout en garantissant aux utilisateurs que leurs données ne seront pas utilisées à mauvais escient.

Nous sommes impatients de faire plus d’annonces sur ce travail très bientôt. Si vous êtes intéressé par la création d’une application utilisant ces bibliothèques, nous vous encourageons à vous inscrire afin de consulter la Oasis Devnet.



Traduction de l’article de The Oasis Team : Article Original

BlockBlog

Le Meilleur de l'Actualité Blockchain Francophone & Internationale | News, Guides, Avis & Tutoriels pour s'informer et démarrer facilement avec Bitcoin, les Crypto-Monnaies et le Blockchain. En Savoir Plus sur L'Équipe BlockBlog

Commenter cet Article

Commenter cet Article

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Plus dans News

Top