泰勒公式-Taylor


原文链接: 泰勒公式-Taylor

转 如何通俗地解释泰勒公式?

  1. 微分:是一个极限值;是当自变量x变化了一点点(dx)而导致了函数(f(x))变化了多少。
    比如,国民收入Y=f(x),x是消费,那x变化了dx时,会导致Y变化多少呢?变化dY,这就是微分,而dY/dx就是这个单变量函数的导数。把微分dY视为dx的线性函数,那么导数就是这个线性函数的系数:注意,这个视角甚至可以推广到微分流形、泛函,等你以后深入学习到更高的层次就会知道,在这里打个伏笔。
  2. 差分:是一个有限值;粗糙地讲,就是离散化的微分,即\(\Delta y\)。当变化量很微小时,就近似看成dy。


泰勒公式一句话描述:就是用多项式函数去逼近光滑函数。

n
是一个正整数。如果定义在一个包含
a
的区间上的函数
f
x_0
点处
n+1
次可导,那么对于这个区间上的任意
x
都有:
对过去的解释
\displaystyle f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x)

对未来的预测
\displaystyle f(x_0+\delta)=\sum_{n=0}^{N}\frac{f^{(n)}(a)}{n!}(x-a)^n+R_n(x)

其中的多项式称为函数在

a
处的泰勒展开式,
R_n(x)

是泰勒公式的余项且是 $(x-x_0)^n$ 的高阶无穷小。
---维基百科

泰勒公式的定义看起来气势磅礴,高端大气。如果

x_0=0
的话,就是
麦克劳伦公式:

\[\displaystyle f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(0)}{n!}x^ n+R_n(x)\]

0.泰勒公式是怎么推导的?

很多同学看到这段时,可能有点看不懂,牛顿插值的几何解释是怎么样的?-知乎

根据"以直代曲、化整为零"的数学思想,产生了泰勒公式。

  1. 把曲线等分为
    n

    份,分别为
    a_1

    a_2
    \cdots
    a_
n
    ,令
    a_1=a

    a_2=a+\Delta
x
    \cdots
    a_
n=a+(n-1)\Delta
x

    。我们可以推出(
    \Delta
^2
    \Delta
^3

    可以认为是二阶、三阶微分,其准确的数学用语是差分,和微分相比,一个是有限量,一个是极限量):

f(a_2)=f(a+\Delta x)=f(a)+\Delta
f(x)
f(a_3)=f(a+2\Delta
x)=f(a+\Delta x)+\Delta f(a+\Delta x)=f(a)+2\Delta f(x)+\Delta
^2f(x)
f(a_4)=f(a+3\Delta
x)=f(a)+4\Delta f(x)+6\Delta ^2f(x)+4\Delta ^3f(x)+\Delta
^4f(x)

也就是说,f(x)全部可以由

a

\Delta x

决定,这个就是泰勒公式提出的基本思想。据此的思想,加上极限
\Delta x
\to 0

,就可以推出泰勒公式。

1.多项式的函数图像特点

\sum_{n=0}^{N}\frac{f^{(n)}(0)}{n!}x^n

展开来就是
f(0)+f\'(0)x+\frac{f\'\'(0)}{2!}x^2+\cdots
+\frac{f^{(n)}(0)}{n!}x^
n

f(0)

\frac{f\'\'(0)}{2!}

这些都是常数,我们暂时不管,先看看其中最基础的组成部分,幂函数有什么特点。

可以看到,幂函数其实只有两种形态,一种是关于

Y

轴对称,一种是关于原点对称,并且指数越大,增长速度越大。

那幂函数组成的多项式函数有什么特点呢?

怎么才能让

x^2

x^9

的图像特性能结合起来呢?

我们来动手试试看看系数之间如何压制的:

点击此处前往操作。

通过改变系数,多项式可以像铁丝一样弯成任意的函数曲线。送你一颗心(虽然是隐函数,意思一下):

2.用多项式对

e^x

进行逼近

e^x

是麦克劳伦展开形式上最简单的函数,有
e
就是这么任性。

$e^x=1+x+\frac{1}{2!}x^2+\cdots + \frac{1}{n!}x^ n + R_n(x)$

增加一个

\frac{1}{4!}x^4

看看。

增加一个

\frac{1}{5!}x^5

看看。

可以看出,

\frac{1}{n!}x^
n

不断的弯曲着那根多项式形成的铁丝去逼近
e^
x
。并且
n
越大,起作用的区域距离0越远。

3.用多项式对

sin(x)

进行逼近

sin(x)

是周期函数,有非常多的弯曲,难以想象可以用多项式进行逼近。

sin(x)=x-\frac{1}{3!}x^3+\cdots +\frac{(-1)^
n}{(2n+1)!}x^{(2n+1)}+ R_
n(x)

同样的,我们再增加一个

\frac{1}{7!}x^7

试试。

可以看到

\frac{1}{7!}x^7

在适当的位置,改变了
x-\frac{1}{3!}x^3+\frac{1}{5!}x^5

的弯曲方向,最终让
x-\frac{1}{3!}x^3+\frac{1}{5!}x^5-\frac{1}{7!}x^7

更好的逼近了
sin(x)

一图胜前言,动手看看

sin(x)
的展开吧:

此处有互动内容,需要流量较大,最好有wifi处打开,土豪请随意。
点击此处前往操作。

4.泰勒公式与拉格朗日中值定理的关系

拉格朗日中值定理:如果函数

f(x)
满足,在
\[a,b\]
上连续,在
(a,b)

上可导,那么至少有一点
\theta
(
a\<\theta
\<b
)使等式
f\'(\theta
)=\frac{f(a)-f(b)}{a-b}

成立。
----维基百科

数学定义的文字描述总是非常严格、拗口,我们来看下拉格朗日中值定理的几何意义:

这个和泰勒公式有什么关系?泰勒公式有个余项

R_
n(x)
我们一直没有提。

余项即使用泰勒公式估算的误差,即

\displaystyle f(x)-\sum
_{n=0}^{N}\frac{f^{(n)}(a)}{n!}(x-a)^ n=R_
n(x)

余项的代数式是,

R_ n(x)=\frac{f^{(n+1)}(\theta
)}{(n+1)!}(x-a)^{(n+1)}

,其中
a\<\theta
\<x

。是不是看着有点像了?

N=0

的时候,根据泰勒公式有,
f(x)=f(a)+f\'(\theta
)(x-a)

,把拉格朗日中值定理中的
b
换成
x

,那么拉格朗日中值定理根本就是
N=0
时的泰勒公式。

结合拉格朗日中值定理,我们来看看

N=0

的时候,泰勒公式的几何意义:

N=0

的时候,泰勒公式几何意义很好理解,那么
N=1,2,\cdots
呢?

这个问题我是这么理解的:首先让我们去想象高阶导数的几何意义,一阶是斜率,二阶是曲率,三阶四阶已经没有明显的几何意义了,或许,高阶导数的几何意义不是在三维空间里面呈现的,穿过更高维的时空才能俯视它的含义。现在的我们只是通过代数证明,发现了高维投射到我们平面上的秘密。

还可以这么来思考泰勒公式,泰勒公式让我们可以通过一个点来窥视整个函数的发展,为什么呢?因为点的发展趋势蕴含在导数之中,而导数的发展趋势蕴含在二阶导数之中......四不四很有道理啊?

泰勒公式的用处

多项式这种函数是我们可以亲近的函数,它们很开放、很坦白,心里想什么就说什么,比如

f(x)=2-3x

,这个多项式会告诉我们想问的任何消息,甚至更多,譬如,我们问:"嘿,老兄,你在4那点的值是多少?"这时
f(x)

会毫不犹豫的回答:"你把4代进来,就会得到
2-3\times
4=-10

,顺便告诉你,我最近长了奇怪的疹子,痒的要命,还好这两天症状减轻了..."。但是
ln(x)

阴暗、多疑,要是问它:"嗨,你在3的值是多少啊?"你得到的答案可能是:"你要干什么?为什么打听别人的私事?你以为凭着你那点加减乘除的三脚猫功夫就可以查出我的底细?况且我在3的值是多少,干你什么事!"
----《微积分之倚天宝剑》

泰勒公式最直接的一个应用就是用于计算,计算机一般都是把

sin(x)

进行泰勒展开进行计算的。

泰勒公式还可以把问题简化,比如计算,

\displaystyle \lim _{x \to
0}\frac{sin(x)}{x}

,代入
sin(x)

的泰勒展开有:
\displaystyle \lim _{x \to 0}\frac{sin(x)}{x}=\lim
_{x \to
0}\frac{x+o(x^3)}{x}=1

,其中
o(x^3)

是泰勒公式里面的余项,是高阶无穷小,
\displaystyle \lim _{x \to
0}o(x^3)=0

。解题神器有没有?
`