无理数指数, 复数指数, 欧拉公式, 复对数

起因

起因是最近在努力想把傅立叶级数和傅立叶变换重学一遍, 完全搞懂. 傅立叶变换用欧拉公式转换成复系数的形式看起来是非常优雅的. 但是遗憾我已经不记得欧拉公式是怎么来的了. 上网查了些资料, 终于搞清楚了.

先把欧拉公式写在这里:

\[ \forall x \in \mathbb{R}, \quad \begin{equation*} e^{ix} = \cos x + i \sin x \end{equation*} \]

这里\(\mathrm{e}\)是自然对数的底, 也叫欧拉数. \(\mathrm{e} \approx 2.718\). \(i\)是虚数单位.

这个公式右边是一个关于\(x\)的三角函数, 函数值落在复数数域里, 也就是一个\(\mathbb{R} \mapsto \mathbb{C}\)的映射.

而左边是一个指数为复数的指数函数. 可是, 指数为复数的幂运算是怎么定义的? 所以为了搞清楚所有这些概念. 需要把复数域幂运算, 复数域对数运算一起串起来. 写了这篇总结相信再不会忘记了.

幂运算

整数指数

先来回顾一下初等代数里关于幂运算的内容.

  1. 最最开始, 我们见到的\(x^n\)运算里, \(x \in \mathbb{R}, \quad n \in \mathbb{Z}^+\). 在这个限制下, 幂运算的定义为\(n\)\(x\)自乘.
  2. 规定\(x^0=1\)
  3. \(x \neq 0\), 定义\(\displaystyle x^{-n}=\frac{1}{x^n}\)

这三个合在一起将运算\(x^n\)里的\(n\)延拓到整数域. 根据这几个定义可以轻松证明下列幂运算的运算性质.

  1. 同底数相乘除,指数相加减: \[ \begin{equation} \begin{aligned} x^a \times x^b = x^{a+b} \\ \frac{x^a}{x^b} = x^{a-b} \end{aligned} \end{equation} \label{eq:sameBaseTimesDivide} \]

  2. 幂的幂,指数相乘: \[ \begin{equation} \begin{aligned} (x^a)^b = x^{(a \times b)} \end{aligned} \end{equation} \label{eq:powerPower} \]

  3. 指数分配: \[ \begin{equation} \begin{aligned} (x \times y)^z=x^z \times y^z \\ \left({\frac{x}{y}}\right)^z=\frac{x^z}{y^z} \end{aligned} \end{equation} \label{eq:powerDistributiveLaw} \]

我们也可以轻松证明, 把运算里的底数\(x\)延拓到整个非零复数域, 这些运算性质依然成立.

正实数底的实数指数次幂

如果我们在运算\(a^x\)中把底数\(a\)的定义域限定到正实数. 对于\(\forall a \in \mathbb{R}^+\), \(a^x\)变为关于\(x\)的指数函数. 进一步延拓指数的定义范围.

  1. \(\displaystyle x=\frac{1}{n}, \quad n \in \mathbb{Z}^+\), 定义\(a^x\)\(\sqrt[n]{a}\)的正实数根.
  2. \(\displaystyle x=\frac{m}{n}, \quad n \in \mathbb{Z}^+, \quad m \in \mathbb{Z}\), 定义\(a^x = \sqrt[n]{a^m}\)

由于已知有理数是跟分数一一对应的可数集合. 所以上面的定义5就把指数延拓到整个有理数集合了.

无理数指数

我们肯定希望我们定义的无理数指数可以使指数函数\(a^x\)是个连续函数. 所以可以用极限来定义无理数指数. 已知无理数为无限不循环小数, 所以可以做出两个有理数数列来趋近这个无理数. 设\(x=\alpha\)是无理数, 我们取其前n位有效数字, 舍去剩下的小数得到的值为\(r_n\). 取其前\(n-1\)个有效数字加上第n个有效数字进位得到的值为\(s_n\). 称\(\{r_n\}\)为不足近似值数列, \(\{s_n\}\)为过剩近似值数列. 举个例子, 对于\(\pi\)来讲:

\[ \begin{align*} \{r_n\} &= \{3,\: 3.1,\: 3.14,\: 3.141,\: 3.1415\} \\ \{s_n\} &= \{4,\: 3.2,\: 3.15,\: 3.142,\: 3.1416\} \end{align*} \]

由这两个数列的定义可知\(\{r_n\}\)单调递增, \(\{s_n\}\)单调递减. 且\(\alpha = sup\{r_n\}=inf\{s_n\}\) (\(sup\)是上确界, \(inf\)是下确界). 易知\(\displaystyle\lim_{n \to +\infty}{r_n} = \lim_{n \to +\infty}{s_n} = \alpha\), 则 \[\begin{equation}\lim_{n \to +\infty}{s_n - r_n} = 0 \end{equation}\]

下面只需要证明这两个极限\(\displaystyle\lim_{n \to +\infty} {a^{r_n}}\)\(\displaystyle\lim_{n \to +\infty} {a^{s_n}}\)都存在且相等, 就可以用这个极限来定义一个实数的无理数指数了.

先假设\(a>1\), 由于我们要定义无理数指数使指数函数\(a^x\)在实数域上是个连续函数, 而已知这个指数函数当\(a>1\)时是个单调递增函数. 所以我们定义的无理数指数一定是使不等式\(a^{r_n} < a^\alpha < a^{s_n}\)成立. 由于单调有界数列必有极限. 所以这两个极限\(\displaystyle\lim_{n \to +\infty}{a^{r_n}}\)\(\displaystyle\lim_{n \to +\infty}{a^{s_n}}\)都存在. 由下式可知

\[ \begin{equation} \displaystyle\frac{\lim_{n \to +\infty}{a^{s_n}}}{\lim_{n \to +\infty}{a^{r_n}}} = \lim_{n \to +\infty}{\frac{a^{s_n}}{a^{r_n}}} = \lim_{n \to +\infty}{a^{s_n-r_n}}=1 \end{equation} \]

对于\(0<a<1\)的情况, 可以用相同的办法讨论, 只有单调方向不同. \(a=1\)的清况是平凡的.

6-1. 若\(x=\alpha\)为无理数, 定义指数函数\(\displaystyle a^\alpha = \lim_{n \to +\infty}{a^{r_n}} = \lim_{n \to +\infty}{a^{s_n}}\)

到此为止, 幂运算, 底数为正实数, 指数为全体实数, 值为正实数的各种情况已经被很好的定义了. 而且这些定义都可以让前面提到的几条指数运算性质成立. 但后面我们会看到, 一旦我们把指数运算延拓到复数, 有些运算性质就不再成立了.

我们可以看到这里的定义虽然直观, 理解起来容易. 但总感觉不够美观, 跟之前的定义不够统一. 其实这里还有其他的定义方法, 我们先列出这个定义方法.

6-2. 对于任意实数\(a\), \(a>0\), 以及任意实数\(x\), 定义\(a^x = \mathrm{e}^{x \cdot \ln{a}}\)

这个定义看起来好像是个循环定义, \(\mathrm{e}\)的无理数次幂不也还没定义呢么. 所以如果想这个定义成立, 还得先用别的办法定义\(\mathrm{e}\)的实数次幂.

\(\mathrm{e}\)的实数次幂

这里有两种办法可以定义\(\mathrm{e}\)的实数次幂

方法1, 直接利用极限.

首先我们已知\("\mathrm{e}\)可以通过极限\(\displaystyle\lim_{n \to +\infty}{\left(1 + \frac{1}{n}\right)^n}\)来定义.

那么对于任意实数\(x\), 可以定义\(\displaystyle\mathrm{e}^x=\lim_{n \to +\infty}{\left(1+\frac{x}{n}\right)^n}\)

可以简单证明在\(x\)为正整数的时候, 上述定义跟之前的自乘的定义可以互相推导.

\[ \begin{align*} \mathrm{e}^k &= \left[\lim_{n \to \infty }{\left(1+\frac{1}{n}\right)^n}\right]^k \\ &=\lim_{n \to \infty }{\left[\left(1+\frac{1}{n}\right)^n\right]^k} \\ &=\lim_{n\cdot k \to \infty }{\left(1+\frac{k}{n \cdot k}\right)^{n\cdot k}} \\ &=\lim_{m \to \infty}{\left(1+\frac{k}{m}\right)^m} \end{align*} \]

方法2, 使用泰勒级数定义

\[ \mathrm{e}^x = 1+x+\frac{x^2}{2!}+\frac{x^3}{3!} + \cdots = \sum_{n=0}^{+\infty}{\frac{x^n}{n!}} \]

有了这个\(\mathrm{e}^x\)的定义, 任何正实数的实数次幂都可以统一定义成6-2的形式. 甚至复数也可以统一成这个定义.

正实数底的复数次幂

跟前面实数一样, 想要把任何正实数的复数次幂也定义成6-2的式子, 必须先定义\(\mathrm{e}\)的复数次幂. 这就终于要轮到欧拉公式出场了.

欧拉公式

对于任意实数\(x\), 任意复数\(z=a+bi\), 可以证明: \[ \begin{align*} \mathrm{e}^{ix} &= \cos x+i\cdot\sin x \\ \mathrm{e}^z &= \mathrm{e}^a(\cos b+i\cdot\sin b) \end{align*} \] 证明有多种方法, 比如用泰勒级数也可以证明. 首先把\(\mathrm{e}^x\), \(\cos x\), 和\(\sin x\)的泰勒级数展开写出来作为已知条件: \[ \begin{align*} &\mathrm{e}^x = 1+x+\frac{x^2}{2!}+\frac{x^3}{3!} + \cdots \\ &\cos x = 1 - \frac{x^2}{2!} + \frac{x^4}{4!} - \frac{x^6}{6!} + \cdots \\ &\sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \frac{x^7}{7!} + \cdots \end{align*} \]\(x=iy\)带入\(\mathrm{e}^x\)可简单的证明欧拉公式得.

定义

有了欧拉公式, 再定义正实数的复数次幂就容易了. 形式重复6-2.

  1. \(a\)是一个正实数, \(z\)是任何复数, \(a^z\)可以定义成\(\mathrm{e}^{z\cdot\ln(a)}\).

非零复数的复数次幂

定义7已经将指数延拓到整个复数, 现在开始考察底数的进一步延拓. 之前之所以一直限定底数为正实数, 是因为初等数学里定义7里出现的\(\ln a\)的自变量是正实数. 但我们现在有了欧拉公式, 可以把对数运算延拓到复数范围.

复平面上的对数运算

对数函数在正实数定义域上的定义是指数函数的反函数, 或者说\(x=\ln a\)\(x\)是方程\(\mathrm{e}^x=a\)的唯一解. 在复数范围内, 也可以将\(z=ln(a+bi)\)定义成方程\(\mathrm{e}^z=a+bi\)的解, 但这个解并不唯一. 换句话说复指数函数的反函数是个多值函数.

考虑复数\(w=a+bi\)的几何意义, 把复平面从a,b为轴的笛卡尔坐标系转换成极坐标, 定义\(\sqrt{a^2+b^2}\)为复数\(w\)的模. 表示为\(|w|\). 定义从正实数轴到复数在复平面上的对应的向量所成的角叫做辐角, 记为Arg(w). 由几何意义易知一个复数点对应的辐角是相差\(2k\pi\)的无穷多个角度值, 其中在\((-\pi,\pi]\)的那个值叫做辐角主值, 记为\(\theta\). 根据欧拉公式上这些定义可以算出对数以\(\mathrm{e}\)为底的对数\(\mathrm{Ln}w = \ln |w|+i(\theta+2k\pi)\), 其中\(k\)为整数. 注意这里用的是大写L开头, 代表多值函数, 如果我们限定辐角必须是辐角主值, 就又变成单值函数了, 用\(\ln w\)表示.

定义

结合对数运算和定义7, 可以得到最终复数域中一般幂函数(或指数函数)的定义如下:

  1. \(w^z=e^{w\cdot \mathrm{Ln}z}, \quad w,z \in \mathbb{C}, w \neq 0\)

运算性质

由于我们得到这个最终的定义变为一个多值函数, 这就导致前面提到运算性质\(\eqref{eq:powerPower}\)\(\eqref{eq:powerDistributiveLaw}\)不再成立了.

前置知识

数列, 极限, 级数, 泰勒级数

参考网页

1 2 3