什么是足球高斯指数?
一、基本概念 高斯过程(Gaussian Process)是一种随机过程,它的所有点统计量都是均值为0的噪声分布,其方差满足高斯分布。在概率论中,高斯分布(又称正态分布)是一种比较重要的概率分布图式;而将这一性质运用到时间序列或函数上时,我们称之为“高斯过程”。 所谓指数加权平均,即是对应的数值按照权重进行加权求和,其原理与指数加权平均法类似。
二、相关算法
1. GPR (1)基本思想:GPR是利用数据本身来拟合模型参数的一种方法,它采用一种叫做“基函数"的函数来逼近待估参数,这些基函数通常被称为核函数(Kernel),它们通常都具有连续可微的特点,常见的有RBF核等;GPR还采用了高斯噪声估计(GP prior)来对模型本身的误差做出估计。具体地,对于给定的观测样本\left({x}_{i},{y}_{i}\right), i=1,2,\cdots ,n \quad (a) 首先通过训练确定核函数的参数,\theta ; (b) 然后根据已知的参数,以及高斯噪声协方差C_{\epsilon }计算出每个数据点的预测值p(\tilde{{x}}_{i})=\sum _{j=1}^{\mathrm {T}} k\(\frac {\tilde {{x}}_i-{x}_j}{\sigma_g}, \frac {h}{\sqrt {\sigma _g\sigma_l}}\)\mu _j+N[0,c\cdot h^2] ,其中\tilde{{x}}_{i},\,\mu _j 和\sigma _g分别为待测输入向量的坐标,均值和标准差。
(2)推导思路
第一步:先给出模型的基本形式
第二步:得到上述模型的近似解后,需要对其进行检验以得出最优结果。为此需定义似然函数为:L(\lambda )=P\(\left|MSE\right|\leq a,\,λ;\, y^{obs},\,\mathbf X^{train}\) 第三步:使用Baysian框架下的极大似然法得最优模型参数 第四部:最后一步是根据得到的模型进行预测。
2. GPBoost 最优的GPR模型应该是具有最小的交叉验证误差的模型,但是一个完整的训练过程可能很花费时间,所以可以采用BP算法快速获得近似的最优解。由于该问题是优化问题,所以可以使用梯度下降的思想来实现,也就是迭代最小化误差平方和,从而实现对参数的更新。
三、应用
1. 回归问题 在实际生活中经常会遇到这样的一个问题就是当已知大量的数据点之后,希望得到在这些数据点上函数的近似。这时,我们就可以把这个问题看作是回归的问题。
2. 分类问题 同样在现实生活也有这样的问题存在:在一个给定集里已经存在了大量的实例,我们希望找到一些能够把这些实例划分且又能最好地对新的例子进行划分的分割超平面。因此这就是一个简单且经典的分类问题。