Translations:Attention Mechanisms/15/es

    From Marovi AI

    Vaswani et al. (2017) introdujeron la formulación utilizada en el transformer. Dadas las matrices de consultas $ Q $, claves $ K $ y valores $ V $: