COVID-19数据预测算法
  • 问题介绍
  • 应用场景
  • 算法特点
  • 在线测试
  • 商品评价

本算法适用于将未处理过的时间序列数据通过不同类别的处理方法,进行时序数据变换来获得稳定性数据,再为较为合理的预测作数据支撑。在回归预测中,时间序列数据是最常见,也是最常用到的数据。经典回归分析暗含着一个重要假设:数据是平稳的,如果数据非平稳,那么大样本下的统计推断基础“一致性”要求就会受到破坏,从而导致出现“虚假回归”问题。然而在现实生活中,情况往往是实际的时间序列数据是非平稳的,那么对数据进行时序数据变换来获得稳定性数据就十分有必要。




新冠病毒正在全球肆虐,给人们带来了很大的威胁,如何精准预测在未来一段时间内的感染人数就成为了一件很重要的事情。



1. 处理方式多样

可以使用Differencing差分方法、移动平均法、分解法来对数据进行处理。

2. 检验结果易于分析判断

ADF检验全称是 Augmented Dickey-Fuller test,ADF检验就是判断序列是否存在单位根:如果序列平稳,就不存在单位根;否则,就会存在单位根。 对于一个时间序列是平稳的,它的ADCF测试应该有:p值(p-value)较低。根据原假设1%、5%、10%置信区间的临界值(Critical Value)应尽可能接近测试统计数据(Test Statistic)

3. 预测结果与实际值接近

通过现有的144个数据点,来预测预测额外的120个数据点。预测结果如下,可以发现与实际情况十分接近。