NLP e LLM
Grouped-query attention
Attenzione raggruppata. Variante che condivide chiavi e valori tra più teste per ridurre la memoria.
Gestisci i cookie usati su Glossario Italiano. Puoi modificare le preferenze in qualsiasi momento dal link "Gestisci preferenze" in fondo a ogni pagina.