Translations:Attention Mechanisms/15/es
Vaswani et al. (2017) introdujeron la formulación utilizada en el transformer. Dadas las matrices de consultas $ Q $, claves $ K $ y valores $ V $:
Vaswani et al. (2017) introdujeron la formulación utilizada en el transformer. Dadas las matrices de consultas $ Q $, claves $ K $ y valores $ V $: