Translations:Convolutional Neural Networks/31/es
- Usa modelos preentrenados (transfer learning) cuando los datos etiquetados sean limitados.
- Prefiere kernels pequeños ($ 3 \times 3 $) apilados en profundidad — dos capas $ 3 \times 3 $ tienen el mismo campo receptivo que una capa $ 5 \times 5 $ pero con menos parámetros.
- Aplica la normalización por lotes después de la convolución y antes de la activación.
- Usa aumento de datos generosamente para reducir el sobreajuste.
- Reemplaza las capas totalmente conectadas con global average pooling para reducir parámetros.