Las incrustaciones posicionales aprendidas y las codificaciones posicionales relativas (por ejemplo, RoPE, ALiBi) son alternativas habituales que pueden generalizar mejor a longitudes de secuencia no vistas.