YOLOv5での学習時にlossがnanになった時の対処法

Page content

状況

YOLOv5のtrain.pyでの学習時、box_lossとobj_lossがnanになる

解決策

バッチサイズを小さくする

原因

lossがnanになる問題は様々な原因で起こりますが、上記解決策で解決した場合はメモリ不足が原因と思われます。
loss計算時にメモリが不足していると、異常終了などはせずにlossをnanとして処理続行する実装になっています。

参考URL