Preguntas con la etiqueta [multihead-attention]
Lista
multihead-attention preguntas
Implementación de PyTorch MultiHeadAttention
0
respuestas
0
votos
40
vistas
En la implementación MultiHeadAttention de Pytorch , con respecto a in_proj_weight, ¿es cierto que los primeros elementos embed_dim corresponden a la consulta, los siguientes elementos embed_dim corresponden a la clave