FRM考試作為金融類的考試,里面涉及到數(shù)學的一些基礎知識。其中主要就是概率與統(tǒng)計的內容,在本篇文章中,小編就請來咱們的FRM老師為大家講解FRM數(shù)學基礎中的有關統(tǒng)計學的知識。

樣本變異量是基本統(tǒng)計學一個很難懂也很難教的概念。初學統(tǒng)計學的學生一開始就遇到這個概念,如果沒學懂,很可能就對統(tǒng)計學喪失了信心或興趣。這個概念難懂之處并不只在于它的意義或用處,更在于它的公式:

變異量的概念

首先,我們假設給有一組n個數(shù)目的數(shù)據(jù):X1,X2,X3.......Xn, 他們的樣本平均數(shù)是X。

變異量所要測量的是這一組數(shù)據(jù)彼此間差異的程度,它告訴我們數(shù)據(jù)的同構型或一致性。我們可以先想象這組數(shù)據(jù)全部相同的情況:數(shù)據(jù)彼此之間完全沒有差異,也就是同構型高到不能再高了,一致性也大到不能再大了,此時變異量為0。如果數(shù)據(jù)彼此間差異*大,也就是同構型或一致性*低,此時變異量*大。

然則為何變異量要用上面的公式計算?要算數(shù)據(jù)彼此間差異的程度,不是算出數(shù)目兩兩之間差異的總和或其平均值就好了嗎?這樣說雖然不無道理,但實際上大有問題。

設想我們把數(shù)據(jù)中所有數(shù)目依其大小標在一直在線,一共有n個點,則這些點兩兩之間一共會有C(n,2)=n!/(n-2)!2!個距離,例如n=3會有3個距離,n=4會有6個距離,n=5會有10個距離,等等。但這些距離并不是相互獨立的,因為除了相鄰兩點之間的距離外,其它的距離都可以算出來。舉例來說,若n=3而三點為x1<x2<x3,則共有|x1-x2|、| x2-x3|、|x1- x3|三個距離,但|x1-x2|+| x2-x3|=|x1- x3|,也就是3個距離中只有2個是獨立的,第三個可以由這兩個獨立的距離算出來。推而廣之,直線上n個點x1<x2<…<xn,雖然可有C(n,2)個距離,只有|x1-x2|、| x2-x3|、|x3- x4|、…、|xn-1- xn|這n-1個相鄰兩點之間的距離是獨立的;這n-1個距離知道之后,其它的距離也就知道了。這n-1個相鄰兩點的「獨立」距離,包含了樣本變異量所有的信息,因此我們不妨暫且把n-1喚作「自由度」。換句話說,「自由度」就是樣本變異量所含獨立信息的數(shù)目。

如果我們把總變異量定義為數(shù)據(jù)中這些獨立信息的總和,則當我們把總變異量除以自由度n-1,我們就得到這些獨立信息的平均變異量了。但這樣的定義有一個問題,我們看下式就明白了:

這就等于我們小學時學過的植樹問題:「一條路有90公尺,沿路每邊種了10棵樹,兩端都種,請問每邊樹與樹間的平均距離多少?」這樣來算變異量,除了用到數(shù)據(jù)*數(shù)和*小數(shù)之間的「范圍」(range) 外,完全忽略了中間n-2個相對點位置所含的信息,因此它不是一個適當?shù)姆椒ā?/p>

此外,因為兩數(shù)相減可能得到負數(shù),但距離必須是正的,所以我們常用*值來算距離。但*值函數(shù)y=|x|在x=0的地方有個尖銳轉折,不是一個平滑函數(shù),數(shù)學上不好處理。比較好的消去負號的方法是平方:負負得正。

因此統(tǒng)計學不用數(shù)據(jù)點兩兩之間距離*值的和來算總變異量,而是用每個數(shù)據(jù)點與平均數(shù)距離平方的總和,也就是前面所說的「差方和」。差方和的好處是它用到了數(shù)據(jù)中每一點的位置,但它同時也必須用到樣本平均數(shù)。用了樣本平均數(shù)之后,數(shù)據(jù)中的n個點與平均數(shù)的距離就有一個限制了。

因此它們只包含了n-1個獨立的信息。我們把n-1喚作「自由度」,也就是獨立信息的數(shù)目。把差方和除以「自由度」就得到變異量;它可以詮釋為每個獨立信息對數(shù)據(jù)所含總信息——差方和——的平均貢獻。變異量因為用了距離的平方,必須開根號才能回到原來的距離單位。于是我們把變異量開根號,得到的結果,就是所謂「標準偏差」(standard deviation):

這里講解的FRM數(shù)學基礎知識主要是回答一個問題,即統(tǒng)計學中自由度修正為啥n-1?融躍FRM老師針對這個問題做了詳細解答,如果有什么疑惑,歡迎留言咨詢咱們的老師。