# 收益率概念与平稳性

## 资产收益率

多数金融研究针对的是资产收益率而不是资产价格。

使用收益率有两个主要理由:
1. 对普通的投资者来说,资产收益率完全体现了该资产的投资机会,且与其投资规模无关;
2. 收益率序列比价格序列更容易处理,因为前者有更好的统计性质

然而,资产收益率有多种定义,设 $P_t$ 是资产在 $t$ 时刻的价格。下面给出常见的几个收益率定义.暂时假定资产不支付分红。

### 单期简单收益率

若从第 $t-1$ 天到第 $t$ 天(一个周期)持有某种资产,则**简单毛收益率**为:

$$1+R_{t}=\frac{P_{t}}{P_{t-1}} \quad \text { 或 } \quad P_{t}=P_{t-1}\left(1+R_{t}\right)\tag{1}$$

对应的**单期简单收益率**或称**简单收益率**为:

$$R_{t}=\frac{P_{t}}{P_{t-1}}-1=\frac{P_{t}-P_{t-1}}{P_{t-1}}\tag{2}$$

### 连续复合收益率

资产的简单毛收益率的自然对数称为**连续复合收益率** 或 **对数收益率**:

$$r_{t}=\ln \left(1+R_{t}\right)=\ln \frac{P_{t}}{P_{t-1}}=p_{t}-p_{t-1}\tag{3}$$

其中 $p_{t}=\ln P_{t}$,与简单净收益率 $R_t$ 相比,连续复合收益率 $r_t$ 有一些优点。首先,对多期收益率,我们有:

$$\begin{aligned}
r_{t}[k] &=\ln \left(1+R_{t}[k]\right)=\ln \left[\left(1+R_{t}\right)\left(1+R_{t-1}\right) \cdots\left(1+R_{t-k+1}\right)\right] \\
&=\ln \left(1+R_{t}\right)+\ln \left(1+R_{t-1}\right)+\cdots+\ln \left(1+R_{t-k+1}\right) \\
&=r_{t}+r_{t-1}+\cdots+r_{t-k+1}
\end{aligned}\tag{4}$$

这样,连续复合多期收益率就是它所包含的连续复合单期收益率之和。其次,对数收益率具有更容易处理的统计性质。

In [1]:
import pandas as pd
import numpy as np

stock = pd.read_excel('../数据/上证指数与沪深300.xlsx')
stock['sz收益率'] = 100*np.log(stock['sz']/stock['sz'].shift(1))
stock = stock.dropna()   #删除缺失值
stock = stock.reset_index(drop=True)
stock.head()

Unnamed: 0,日期,hs300,sz,sz收益率
0,2018-01-03,4111.3925,3369.1084,0.618765
1,2018-01-04,4128.8119,3385.7102,0.491555
2,2018-01-05,4138.7505,3391.7501,0.178235
3,2018-01-08,4160.1595,3409.4795,0.52136
4,2018-01-09,4189.2977,3413.8996,0.129558


## 平稳性
### 概念

平稳性是时间序列分析的基础。

时间序列 {$r_t$} 称为**严平稳**的(strictly stationary),如果对所有的 $t$,任意正整数 $k$ 和任意 $k$ 个正整数($t_1,\cdots,t_k$),($r_{t_1},\cdots,r_{t_k}$)的联合分布与($r_{t_1+t},\cdots,r_{t_k+t}$)的联合分布是相同的.换言之,严平稳性要求($r_{t_1},\cdots,r_{t_k}$)的联合分布在时间的平移变换下保持不变。这是一个很强的条件,难以用经验方法验证,经常假定的是平稳性的一一个较弱的形式。

时间序列 {$r_t$} 称为**弱平稳**的(weakly stationary),如果 $r_t$ 的均值与 $r_t$ 和 $r_{t-l}$ 的协方差不随时间而改变,其中 $l$ 是任意整数.更具体地说,{$r_t$} 是弱平稳的,若:
1. $E_{r_t}=\mu$,$\mu$ 是一个常数;
2. $\operatorname{Cov}\left(r_{t}, r_{t-l}\right)=\gamma_{l}$,$\gamma_{l}$ 只依赖于 $l$。

在实际中,假定我们有 $T$ 个数据观测点$\left\{r_{t} | t=1, \cdots, T\right\}$,弱平稳性意味着数据的时间图显示出 $T$ 个值在一个常数水平上下以相同幅度波动。在应用中,弱平稳性使我们可以对未来观测进行推断,即预测。

在弱平稳性的条件中,我们隐含地假定了 $r_t$ 的前两阶矩是有限的.由定义可见,若 $r_t$ 是严平稳的且它的前两阶矩是有限的,则 $r_t$ 也是弱平稳的.反之,一般是不成立的.但如果时间序列 $r_t$ 是正态分布的,则弱平稳性与严平稳性是等价的.本内容主要考虑弱平稳序列。

协方差 $\gamma_{l}=\operatorname{Cov}\left(r_{t}, r_{t-l}\right)$ 称为 $r_t$ 的间隔为 $l$ 的自协方差、它具有两个重要性质:
1. $\gamma_{0}=\operatorname{Var}\left(r_{t}\right)$
2. $\gamma_{-l}=\gamma_{l}$

第二个性质成立是因为$\operatorname{Cov}\left(r_{t}, r_{t-(-l)}\right)=\operatorname{Cov}\left(r_{t-(-l)}, r_{t}\right)=\operatorname{Cov}\left(r_{t+l}, r_{t}\right)=\operatorname{Cov}\left(r_{t_{1}}, r_{t_{1}-l}\right)$,其中$t_{1}=t+l$

在金融文献中,通常假定资产收益率序列是弱平稳的.只要有足够多的历史收益率数据,这个假定可以用实证方法验证,例如,我们可以把数据分成若干子样本,然后检验它们的一致性。

### 单位根所带来的问题
对于 AR(1),一般从理论上认为,不太可能出现 | $\beta_{1} |> 1$ 的情形,否则任何对经济的扰动都将被无限放大。因此,经济学家通常只担心存在单位根的情形, 即 $\beta_{1}=1_{\circ}$ 如果时间序列存在单位根,则为非平稳序列,可能带来以下问题:
1. 自回归系数的估计值向左偏向于 0
2. 传统的 t 检验失效
3. 两个相互独立的单位根变量可能出现伪回归(spurious regression)或伪相关

#### Augmented Dickey-Fuller 单位根检验(ADF检验)

In [2]:
import statsmodels.tsa.stattools as ts
ts.adfuller(stock['sz'])

(-2.3069400422968207,
 0.16973943854299967,
 7,
 451,
 {'1%': -3.444932949082776,
  '5%': -2.867969899953726,
  '10%': -2.57019489663276},
 4390.386487977853)

In [3]:
from arch.unitroot import ADF
ADF(stock['sz'])

0,1
Test Statistic,-2.307
P-value,0.17
Lags,7.0


#### KPSS 平稳性检验

In [4]:
ts.kpss(stock['sz'], nlags='auto')



(0.8735590412113318,
 0.01,
 12,
 {'10%': 0.347, '5%': 0.463, '2.5%': 0.574, '1%': 0.739})

In [5]:
from arch.unitroot import KPSS
KPSS(stock['sz'])

0,1
Test Statistic,0.874
P-value,0.005
Lags,12.0


#### DFGLS 检验

In [6]:
from arch.unitroot import DFGLS
DFGLS(stock['sz'])

0,1
Test Statistic,-0.563
P-value,0.492
Lags,7.0


#### PhillipsPerron(PP)检验

In [7]:
from arch.unitroot import PhillipsPerron
PhillipsPerron(stock['sz'])

0,1
Test Statistic,-2.108
P-value,0.241
Lags,18.0


更多单位根检验请参考:[Unit Root Testing](https://arch.readthedocs.io/en/latest/unitroot/unitroot.html)