移动平均模型 MA

发布时间：2023年9月10日

更新时间：2023年12月25日

白话文

移动平均（MA）模型的原理其实就像是我们在分析一件事情时不仅要考虑明面上的原因，还要考虑那些不那么明显的、幕后的因素。在时间序列分析中，这些幕后的因素被称作“误差项”。

想象你每天的心情都会受到很多因素的影响，有些是你能意识到的，比如天气好坏、工作轻重，但也有些是你没那么容易注意到的，比如你可能没意识到咖啡喝得太多让你焦躁。这些不那么明显的因素，就像是时间序列中的误差项。

在MA模型中，我们假设错综复杂的现实世界里，每一次的观测值（比如说，每天的销售量）都可能会受到前一段时间内一些随机冲击的影响。这些冲击其实是我们预测时没能完全预料到的，它们可能来自于各种各样的随机因素。MA模型就是尝试去捕捉这些冲击，并认为它们会对现在的观测值产生一定的影响。

要理解MA模型，关键是要知道它关注的是“误差项的加权平均”。就是说，我们不仅看今天的情况，还要回头看过去“错误”了多少，然后把这些“过去的错误”按照一定的比重加起来，用来调整我们对当下的理解和未来的预测。

具体来说，这个模型会给过去的每一个误差项一个权重，这个权重就像是告诉我们，过去某一天的误差对今天的影响有多大。我们将这些加权后的过去误差项合在一起，得到一个总的影响值，然后用这个值来帮助我们预测接下来会发生什么。就像是在说，我们要通过理解过去的失误来预测未来，确保我们不会再犯同样的错误，或者至少能够减少它们对未来的影响。

总结一下，MA模型的核心就在于用过去的“偏差”来指导未来，它通过分析过去的随机冲击来预测未来的走势，这样我们就可以更加精确地把握未来，而不是仅仅依赖于现在显而易见的信息。

卖饮料

假设你有一个卖饮料的小摊。在日常经营中，你会发现销售量并不是一成不变的，它会因为很多不同的随机事件而波动。比如某一天天气特别炎热，过路的人可能会买更多的冷饮；或者附近突然有个活动，增加了人流，自然也就可能提高了饮料的销量。与此同时，也有可能天气突然转凉，或者附近的活动取消了，这些都会导致销售量下降。这些你没有预料到的事件造成的销售量的变化，就是我们所说的“误差”。

在MA(1)模型中，我们仅仅考虑昨天的误差对今天销售量的影响。具体来说，如果昨天实际销售量比你预期的要多，这个正的误差就可能意味着今天也有可能销量好于预期；反之，如果昨天销售量比预期少，这个负的误差就可能预示着今天的销售量也可能不尽如人意。

为了将这种误差考虑进去，MA(1)模型会给昨天的误差一个权重，然后将这个加权后的误差值加到你对今天销售量的预测之上。这个权重可以根据过去数据的统计特性来确定，它代表了昨天的误差对今天影响的大小。

如果我们使用MA(2)模型，情况就稍微复杂一些了。这时候，我们不仅要考虑昨天的误差，还要考虑前天的误差。每个误差都会有自己的权重，这些权重告诉我们每个误差对今天销售量的影响程度。将这两天的加权误差加起来，我们就能得到一个更全面的预测值，它不仅反映了昨天的影响，还考虑了前天可能对今天产生的影响。

通过这种方式，我们可以用一种相对科学的方法来预测销售量，而不是单纯依赖直觉。我们的预测会考虑到近期出现的随机波动，并尝试捕捉这些波动对未来销售的可能影响。这样的预测模型更能适应那些不可预知的小冲击，帮助我们更好地为接下来可能出现的情况做准备。

定义与详解

定义

移动平均模型（MA模型）是时间序列分析中的一种统计模型，它通常用于对历史数据进行建模，以预测未来的数据点。该模型基于一个核心假设：未来的观测值可以通过过去一段时间内的观测值的误差项的加权平均来近似。

MA模型中最常见的形式是MA(q)模型，它使用前q个时间点的误差项来预测当前时间点的值。数学上，MA(q)模型可以表示为以下公式：

X_t = \mu + \theta_t + \theta_1\varepsilon_{t-1} + \theta_2\varepsilon_{t-2} + \ldots + \theta_q\varepsilon_{t-q}.

在这个公式中， $X_t$ 是在时间点t的观测值， $\mu$ 是模型的长期平均值， $\varepsilon_t$ 是在时间点t的白噪声误差项，而 $\theta_1, \theta_2, \ldots, \theta_q$ 是模型参数，它们分别代表了过去第1至第q个时间点的误差项对当前观测值 $X_t$ 的影响。

通过调整这些参数( $\theta_1, \theta_2, \ldots, \theta_q$ )，模型可以反映不同的时间序列动态。例如，若某个参数 $\theta_i$ 的绝对值较大，说明该时间点i的误差对当前值的影响较大。这样，我们可以通过拟合历史数据来估计这些参数，使得模型能够捕捉到时间序列的特定特征。

需要注意的是，尽管误差项 $\varepsilon_t$ 的方差会影响时间序列的数值范围，但它并不改变序列的基本特性，如趋势或季节性等。这与自回归模型（AR模型）相似，在AR模型中，时间序列的当前值是通过它自己过去的值来预测的，而在MA模型中，是通过过去的误差项来进行预测。

作为一个简单的例子，假设我们有一个MA(1)模型，即只考虑前一个时间点的误差对当前观测值的影响。假设 $\theta_1$ 的估计值为0.5，当前时间点的误差项 $\varepsilon_t$ 为2，那么上一个时间点的错误影响（ $\theta_1\varepsilon_{t-1}$ ）将是1（0.5 * 2）。这个值会和当前时间点的误差相加，用于预测下一个时间点的观测值。通过这种方式，MA模型能够将过去的信息融入到对未来的预测中。

自回归与移动平均建模的比较

可逆性：

任何一个AR(p)模型其实都是可以用一个MA( $\infty$ )模型来表示的。比如：通过重复的迭代，我们可以用这种方法表示一个AR(1)模型：

\begin{align*} X_t &= \varphi_1X_{t-1} + \varepsilon_t\\ &= \varphi_1(\varphi_1X_{t-2} + \varepsilon_{t-1}) + \varepsilon_t\\ &= \varphi_1^2X_{t-2} + \varphi_1 \varepsilon_{t-1} + \varepsilon_t\\ &= \varphi_1^3X_{t-3} + \varphi_1^2\varepsilon_{t-2} + \varphi_1 \varepsilon_{t-1} + \varepsilon_t\\ &\text{etc.} \end{align*}

假定中 $-1 < \varphi_1 < 1$ ， $\varphi_1^k$ 的值会随着 $k$ 的增大而减小。最终可以得到下式：

X_t = \varepsilon_t + \varphi_1 \varepsilon_{t-1} + \varphi_1^2 \varepsilon_{t-2} + \varphi_1^3 \varepsilon_{t-3} + \cdots,

这是一个 MA( $\infty$ ) 模型。

如果我们对MA模型的系数加以限制，那么我们也可以反过来用AR模型来表示MA模型。这样的MA模型被称为可逆的(invertible)。也就是说，我们可以将任何一个可逆的MA(q)模型表示为一个AR( $\infty$ )模型。

比如，考虑MA(1)模型： $X_{t} = \varepsilon_t + \theta_{1}\varepsilon_{t-1}$ ，在它的 AR( $\infty$ ) 表示中,当前误差可以被表示为现在和历史观测的线性函数： $\varepsilon_t = \sum_{j=0}^\infty (-\theta)^j X_{t-j}.$

其他模型关于可逆性的限制和平稳性的限制类似：

对于MA(1)模型: $-1<\theta_1<1$ 。
对于MA(2)模型: $-1<\theta_2<1, \theta_2+\theta_1 >-1, \theta_1 -\theta_2 < 1$ 。

对于 $q\ge3$ 的MA模型，情况更为复杂。

从定义和应用的角度：

移动平均(Moving average，MA)是以过去的残差项，也就是白噪声来做线性组合；
AR模型是以过去的观察值来做线性组合；

MA的出发点是通过组合残差项来观察残差的振动。MA能有效地消除预测中的随机波动。

当时间序列的数值受周期变动和不规则变动的影响起伏较大，不易显示出发展趋势时，可用移动平均法，消除这些因素的影响，分析预测序列的长期趋势。

代码

python
import numpy as np
import statsmodels.api as sm

# 生成一个示例数据
np.random.seed(0)
n = 100
data = np.random.normal(loc=0, scale=1, size=n)

# 拟合MA模型
model = sm.tsa.ARMA(data, order=(0, 1))  # 这里选择了AR阶数为0，MA阶数为1的MA模型
results = model.fit()

# 预测未来的值
forecast_start = n
forecast_end = n + 10
forecast = results.predict(start=forecast_start, end=forecast_end)

# 打印预测结果
print(forecast)
import numpy as np
import statsmodels.api as sm

# 生成一个示例数据
np.random.seed(0)
n = 100
data = np.random.normal(loc=0, scale=1, size=n)

# 拟合MA模型
model = sm.tsa.ARMA(data, order=(0, 1))  # 这里选择了AR阶数为0，MA阶数为1的MA模型
results = model.fit()

# 预测未来的值
forecast_start = n
forecast_end = n + 10
forecast = results.predict(start=forecast_start, end=forecast_end)

# 打印预测结果
print(forecast)

输出结果：

none

[0.08069388 0.06097477 0.06097477 0.06097477 0.06097477 0.06097477
 0.06097477 0.06097477 0.06097477 0.06097477 0.06097477]

应用

应用领域：

金融市场：MA模型可以用来预测股票价格、汇率变动等金融指标。
经济预测：MA模型可以用来预测经济增长、通货膨胀等经济变量。
环境科学：MA模型可以用于气象数据的预测，如温度、降雨量等。
生产调度：MA模型可以用于预测销售数量、库存量等，以及对生产过程进行调度和管理。

适用问题：

预测：MA模型可根据过去的观测值预测未来的数值。例如，通过MA模型可以预测未来一段时间内的销售量、股价等。
滤波：MA模型可以用于去除时间序列数据中的噪声和异常值。
识别：MA模型可以用于识别时间序列中的规律和趋势，如周期性、季节性等。
研究：MA模型可以用于数据分析和研究，以揭示时间序列数据中的潜在模式和关联关系。

优缺点

优点：
1. 简单可解释：MA模型是一种较为简单的模型，易于理解和解释。
2. 灵活性：MA模型可以适应不同类型的时间序列数据，可以通过调整模型的阶数（滞后项数量）来提高预测精度。
3. 数据要求低：MA模型对数据的要求较低，主要依赖于数据的平稳性和自协方差。
缺点：
1. 误差项的自相关性：MA模型假设误差项是相互独立的，但实际情况中误差项往往具有一定的自相关性。如果误差项存在自相关性，会导致模型的不准确性。
2. 数据平稳性：MA模型要求时间序列数据是平稳的，即均值和方差在时间上保持不变。如果时间序列数据不满足平稳性假设，需要进行差分处理或转换。