反向传播的链式法则
反向传播的链式法则,也称为链式求导法则,是深度学习中常用的一种微分算法,用于计算复杂模型中每一个参数的梯度。它使用了微积分中的链式求导,利用了求导时可以将复杂函数拆成若干个简单函数及它们之间的乘积、和、差等基本运算,从而加快了求导的过程,对深度学习算法的训练有着重要的作用。目前,该算法广泛应用于神经网络、支持向量机等机器学习任务中。
具体来说,链式求导有两个基本原则:全微分和链式法则。
1、 全微分: 对复合函数,有多种可能的求导,如三角函数、指数函数等,但全微分要求,对其中任意一个变量的求导,都必须在已知其他变量的情况下考虑其他变量的影响。
2、链式 求导法则: 链式求导法则规定:在函数连续的部分,把复杂的求导过程拆分成若干个简单的求导,最后把它们的结果相乘,得到总的求导结果。这也就是链式法则的核心思想,即把一个复杂的求导过程拆分成若干个相互独立、简单的求导过程,最后再将它们的结果进行乘积。
>指数函数求导