试题详情

机器学习训练时,Mini-Batch的大小优选为2的幂,如256或512。它背后的原因是()。

AMini-Batch为偶数的时候,梯度下降算法训练的更快

BMini-Batch设为2的幂,是为了符合CPU

C不使用偶数时,损失函数是不稳定的

D以上答案都不正确