试题详情

有许多种梯度下降算法,其中两种最出名的方法是l-BFGS和SGD。l-BFGS根据二阶梯度下降而SGD是根据一阶梯度下降的。 只有在数据很稀疏的场景中,会更加偏向于使用l-BFGS而不是SGD

A正确

B错误