Translations:Convolutional Neural Networks/31/es
- Usar modelos preentrenados (aprendizaje por transferencia) cuando los datos etiquetados sean limitados.
- Preferir núcleos pequeños ($ 3 \times 3 $) apilados en profundidad — dos capas $ 3 \times 3 $ tienen el mismo campo receptivo que una capa $ 5 \times 5 $ pero con menos parámetros.
- Aplicar normalización por lotes después de la convolución y antes de la activación.
- Usar aumento de datos de forma generosa para reducir el sobreajuste.
- Sustituir las capas totalmente conectadas por pooling promedio global para reducir parámetros.