Deep Learning
GELU
Funzione di attivazione GELU. Non linearità liscia usata nei Transformer che pesa gli input in modo probabilistico.
Gestisci i cookie usati su Glossario Italiano. Puoi modificare le preferenze in qualsiasi momento dal link "Gestisci preferenze" in fondo a ogni pagina.