1. 梯度下降 梯度下降是优化神经网络参数的核心算法,通过迭代调整参数最小化损失函数。 核心公式 参数更新规则: θt+1=θt−α∇J(θt)θ_{t+1} = θ_t - \alpha \nabla J(θ_t)θ