ChatGPT, modèles de langage et données personnelles : quels risques pour nos vies privées ?

Gaspard Berthelier; Antoine Boutet

Scientific Blog Post Year : 2023

ChatGPT, modèles de langage et données personnelles : quels risques pour nos vies privées ?

(1) , (1)

Gaspard Berthelier

Function : Author
PersonId : 1331324

Privacy Models, Architectures and Tools for the Information Society

Antoine Boutet

Function : Author
PersonId : 6722
IdHAL : antoine-boutet
IdRef : 170309207

Privacy Models, Architectures and Tools for the Information Society

Abstract

Les grands modèles de langage ont récemment attiré beaucoup d'attention, notamment grâce à l'agent conversationnel ChatGPT. Cette plate-forme est devenue virale en seulement quelques mois et a déclenché une course effrénée pour développer de nouveaux modèles de langage toujours plus efficaces et puissants, rivalisant avec l'humain pour certaines tâches. Cette croissance phénoménale est d'ailleurs jugée dangereuse par de nombreux acteurs du domaine, qui plaident pour une pause afin d'avoir le temps de débattre sur l'éthique en IA et de mettre à jour les réglementations. Une des grandes questions qui se pose est l'articulation entre intelligence artificielle et vie privée des utilisateurs. En particulier, les prouesses des grands modèles de langage sont dues à un entraînement intensif sur d'énormes ensembles de données, qui contiennent potentiellement des informations à caractère personnel, car il n'y a pas d'obligation d'anonymiser les données d'entraînement. Il est alors difficile de garantir en pratique que le modèle ne compromet pas la confidentialité des données lors de son utilisation. Par exemple, un modèle pourrait générer des phrases contenant des informations personnelles qu'il a vues pendant sa phase d'entraînement.

Domains

Computer Science [cs]

Fichier principal

TheConversation___chatGPT.pdf (128.99 Ko)

Origin : Files produced by the author(s)

Antoine Boutet : Connect in order to contact the contributor

https://hal.science/hal-04371691

Submitted on : Wednesday, January 3, 2024-11:49:15 PM

Last modification on : Friday, January 26, 2024-8:35:34 AM

Dates and versions

hal-04371691 , version 1 (03-01-2024)

Licence

Attribution

Identifiers

HAL Id : hal-04371691 , version 1

Cite

Gaspard Berthelier, Antoine Boutet. ChatGPT, modèles de langage et données personnelles : quels risques pour nos vies privées ?. 2023. ⟨hal-04371691⟩

Export

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INRIA INSA-LYON INRIA-MECSCI INRIA2 CITI INSA-GROUPE UDL ANR CYBERSCURITE

32 View

24 Download

ChatGPT, modèles de langage et données personnelles : quels risques pour nos vies privées ?

Abstract

Domains

Dates and versions

Licence

Identifiers

Cite

Export

Collections

Share