Quels sont les schémas d'initialisation des poids de filtre pour les couches convolutionnelles et comment les configurer ?

Question

Initialisation : Stabiliser la Convergence

Nicolas Housset · Accepted Answer

Le paramètre  permet de spécifier le schéma d'initialisation des poids des filtres pour les couches telles que . Voici les options courantes :CAUCHY : Les poids sont initialisés de manière que la médiane soit 0 et l'échelle soit 1.MSRA (inclut MSRA1, MSRA2) : Utilise le schéma d'initialisation de He et al. (2015), adapté aux fonctions d'activation ReLU.NORMAL : Les poids sont initialisés selon une distribution normale avec une moyenne de 0 et un écart-type de 1. Vous pouvez ajuster ces valeurs avec les paramètres  et .UNIFORM : Les poids sont initialisés selon une distribution uniforme avec une moyenne de 0 et une demi-étendue de 1.XAVIER (inclut XAVIER1, XAVIER2) : Utilise le schéma d'initialisation de Glorot et Bengio (2010), adapté aux fonctions d'activation sigmoïde ou tanh.Pour l'initialisation , vous pouvez également spécifier : : La valeur moyenne pour l'initialisation normale (par défaut 0). : L'écart-type pour l'initialisation normale (par défaut 1). : Un seuil de troncature pour l'initialisation normale, défini comme  (par défaut 0).Le paramètre  (alias ) permet de définir le biais initial de la couche (par défaut 0).

Quels sont les schémas d'initialisation des poids de filtre pour les couches convolutionnelles et comment les configurer ?

Exemples pour l'action addLayer

1. Ajout de la couche d'entrée (INPUT)

2. Ajout d'une couche de convolution (CONVO)

Assemblage d'un réseau CNN de bout en bout

Conseil de l'Expert

Action CAS associée

À lire aussi...