Algorithmic and theoretical aspects of sparse deep neural networks

Quoc-Tung Le

Thèse Année : 2023

Algorithmic and theoretical aspects of sparse deep neural networks

Aspects algorithmiques et théoriques des réseaux de neurones profonds parcimonieux

(1)

Quoc-Tung Le

Fonction : Auteur
PersonId : 752424
IdHAL : quoc-tung-le
ORCID : 0009-0009-9952-2194

Optimisation, Connaissances pHysiques, Algorithmes et Modèles

Résumé

Sparse deep neural networks offer a compelling practical opportunity to reduce the cost of training, inference and storage, which are growing exponentially in the state of the art of deep learning. In this presentation, we will introduce an approach to study sparse deep neural networks through the lens of another related problem: sparse matrix factorization, i.e., the problem of approximating a (dense) matrix by the product of (multiple) sparse factors. In particular, we identify and investigate in detail some theoretical and algorithmic aspects of a variant of sparse matrix factorization named fixed support matrix factorization (FSMF) in which the set of non-zero entries of sparse factors are known. Several fundamental questions of sparse deep neural networks such as the existence of optimal solutions of the training problem or topological properties of its function space can be addressed using the results of (FSMF). In addition, by applying the results of (FSMF), we also study the butterfly parametrization, an approach that consists of replacing (large) weight matrices by the products of extremely sparse and structured ones in sparse deep neural networks.

Les réseaux de neurones profonds parcimonieux offrent une opportunité pratique convaincante pour réduire le coût de l'entraînement, de l'inférence et du stockage, qui augmente de manière exponentielle dans l'état de l'art de l'apprentissage profond. Dans cette présentation, nous introduirons une approche pour étudier les réseaux de neurones profonds parcimonieux à travers le prisme d'un autre problème : la factorisation de matrices sous constraints de parcimonie, c'est-à-dire le problème d'approximation d'une matrice (dense) par le produit de facteurs (multiples) parcimonieux. En particulier, nous identifions et étudions en détail certains aspects théoriques et algorithmiques d'une variante de la factorisation de matrices parcimonieux appelée factorisation de matrices à support fixe (FSMF), dans laquelle l'ensemble des entrées non nulles des facteurs parcimonieux est connu. Plusieurs questions fondamentales des réseaux de neurones profonds parcimonieux, telles que l'existence de solutions optimales du problème d'entraînement ou les propriétés topologiques de son espace fonctionnel, peuvent être abordées à l'aide des résultats de la (FSMF). De plus, en appliquant les résultats de la (FSMF), nous étudions également la paramétrisation du type "butterfly", une approche qui consiste à remplacer les matrices de poids (larges) par le produit de matrices extrêmement parcimonieuses et structurées dans les réseaux de neurones profonds parcimonieux.

Mots clés

Matrix factorisation Sparse deep neural networks Sparsity Optimisation

Factorisation de matrices Réseaux de neurones profonds parcimonieux Parcimonie Optimisation

Domaines

Réseau de neurones [cs.NE] Apprentissage [cs.LG] Complexité [cs.CC] Optimisation et contrôle [math.OC]

Fichier principal

LE_Quoc_Tung_2023ENSL0105_These.pdf (3.57 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://inria.hal.science/tel-04329531

Soumis le : mercredi 24 janvier 2024-11:09:08

Dernière modification le : vendredi 26 avril 2024-05:25:19

Dates et versions

tel-04329531 , version 1 (07-12-2023)

tel-04329531 , version 2 (24-01-2024)

Identifiants

HAL Id : tel-04329531 , version 2

Citer

Quoc-Tung Le. Algorithmic and theoretical aspects of sparse deep neural networks. Neural and Evolutionary Computing [cs.NE]. Ecole normale supérieure de lyon - ENS LYON, 2023. English. ⟨NNT : 2023ENSL0105⟩. ⟨tel-04329531v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-LYON UNIV-LYON3 UGA CNRS INRIA UNIV-LYON1 UNIV-LYON2 INSA-LYON STAR INRIA2 TDS-MACS THESES-ENS-LYON INSA-LYON-THESES INSA-GROUPE UDL

139 Consultations

68 Téléchargements

Algorithmic and theoretical aspects of sparse deep neural networks

Aspects algorithmiques et théoriques des réseaux de neurones profonds parcimonieux

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager