carpet119

Resultados 1 preguntas formuladas por carpet119

En la implementación MultiHeadAttention de Pytorch , con respecto a in_proj_weight, ¿es cierto que los primeros elementos embed_dim corresponden a la consulta, los siguientes elementos embed_dim corresponden a la clave