・まず適切なネットワークサイズを見極める。
 - そのために複数のGPUを使い、異なるネットワークで学習を平行実行する。
・サチり始めてから過学習が始まるまではかなり時間がかかり、結果もそこまで良くならない。
・学習データが多いとAugmentationの効果が薄く、学習時間が長くなるだけな場合もある。