Translations:Convolutional Neural Networks/31/es

Usa modelos preentrenados (transfer learning) cuando los datos etiquetados sean limitados.
Prefiere kernels pequeños ( $3 \times 3$ ) apilados en profundidad — dos capas $3 \times 3$ tienen el mismo campo receptivo que una capa $5 \times 5$ pero con menos parámetros.
Aplica la normalización por lotes después de la convolución y antes de la activación.
Usa aumento de datos generosamente para reducir el sobreajuste.
Reemplaza las capas totalmente conectadas con global average pooling para reducir parámetros.