二維變量有什么性質(zhì)?
性質(zhì)1: 設(shè)X是一個(gè)隨機(jī)變量,其分布函數(shù)為F(x),則Y=F(X)服從在〔0,1〕的均勻分布。 性質(zhì)2: 設(shè)X1,K,Xn是某個(gè)分布的一個(gè)簡(jiǎn)單樣本,其分布函數(shù)為F(x),由性質(zhì)1可知,在概率意義下,F(xiàn)(X1),F(X2),K,F(Xn)在(0,1)上呈均勻分布,按從小到大依次排序,記為F(X1),F(X2),K,F(Xn),其相應(yīng)理論值應(yīng)為ri=i-0,5[]n,i=1,2,…,n,對(duì)應(yīng)分布函數(shù)的反函數(shù)值F-1(r1),F-1(r2),K,F-1(rn)(在卡方分布中即為卡方分?jǐn)?shù))應(yīng)非常接近X1,X2K,Xn,故在概率意義下,這些散點(diǎn)(X1,F-1(r1)),(X2,F-1(r2)),L,(Xn,F-1(rn))應(yīng)在一條直線上。 根據(jù)性質(zhì)2,如果X服從正態(tài)分布,則散點(diǎn)理論上應(yīng)落在一直線上,可以用Pearson系數(shù)刻畫(huà)這種分布。但由于隨機(jī)變異的存在,Pearson系數(shù)并不等于1,所以通過(guò)隨機(jī)模擬的方法,制定出Pearson系數(shù)的95%界值下限。 性質(zhì)3: 由條件概率公式P(X,Y)=P(Y|X)P(X)可知:(X,Y)服從二元正態(tài)分布的充分必要條件是固定X,Y服從正態(tài)分布(條件概率分布)并且X的邊際分布為正態(tài)分布。由線性回歸的性質(zhì)ε=Y-(α+βX)可知,固定X,Y的條件概率分布為正態(tài)分布的充分必要條件是線性回歸的殘差ε服從正態(tài)分布,由此可得:(X,Y)服從二元正態(tài)分布的充分必要條件是X的邊際分布為正態(tài)分布以及線性回歸模型Y=α+βX+ε中的殘差服從正態(tài)分布。 設(shè)X來(lái)自于正態(tài)總體,從正態(tài)總體中隨機(jī)模擬抽樣5000次,每次抽樣樣本含量分別為7至50,對(duì)F(x)求秩,求出排序后的F(x)和排序后的X的Pearson相關(guān)系數(shù)。表1 隨機(jī)模擬5000次得e69da5e887aae79fa5e9819331333337626165到的檢驗(yàn)正態(tài)分布的Pearson相關(guān)系數(shù)的界值(略) 類(lèi)似地,我們也可以用同樣的方法得到檢驗(yàn)卡方分布的Pearson相關(guān)系數(shù)的界值表(簡(jiǎn)化表)表2 相關(guān)系數(shù)界值表(略) 2 隨機(jī)模擬驗(yàn)證 21 Pearson相關(guān)系數(shù)界值表的隨機(jī)模擬驗(yàn)證 設(shè)X來(lái)自于正態(tài)總體,從正態(tài)總體中隨機(jī)模擬抽樣5000次,每次抽樣樣本含量分別為10,20,30,40,50,并計(jì)算相應(yīng)的Pearson卡方系數(shù),以及落在界值外面的比例,即拒絕比例,再在同一批數(shù)據(jù)的前提下用McNemar檢驗(yàn)比較本方法和Swilk法的差別。表3 (一元正態(tài)分布)模擬次數(shù)(略)表4(一元偏態(tài)分布,χ2)模擬次數(shù)(略) 以上方法拒絕比例在樣本量為7的可信區(qū)間為[78.37%,94.12%],在其余樣本量時(shí)都接近100%,可以證實(shí)是正確的。 22 卡方分布界值表的隨機(jī)模擬驗(yàn)證 表5 卡方分布:模擬5000次(略) 23 馬氏距離的隨機(jī)模擬驗(yàn)證 根據(jù)馬氏距離的定義,從正態(tài)分布總體中隨機(jī)抽取樣本量分別為10,20,30,40,50的樣本模擬5000次,根據(jù)上面提到的方法以卡方分?jǐn)?shù)對(duì)X1,X2K,Xn求Pearson系數(shù),并根據(jù)以上的相關(guān)系數(shù)界值表,計(jì)算相應(yīng)的統(tǒng)計(jì)量,即拒絕比例。表6 馬氏距離落在Pearson系數(shù)界值表外的比例(略) 24 二元正態(tài)分布資料的隨機(jī)模擬驗(yàn)證 設(shè)定一個(gè)二維矩陣A,分別求出特征值P和特征向量Z,設(shè)X的元素均來(lái)自于正態(tài)總體分布,則Y=Z′×X必服從二元正態(tài)分布,隨機(jī)模擬5000次,根據(jù)性質(zhì)三介紹的方法驗(yàn)證的拒絕比例如下。表7 (二元正態(tài)分布)模擬次數(shù)(略)表8 (二元偏態(tài)分布,χ2)模擬次數(shù)(略) 25 三元正態(tài)分布資料的隨機(jī)模擬驗(yàn)證 類(lèi)似地,隨機(jī)模擬5000次,用同樣方法進(jìn)行驗(yàn)證,得到對(duì)于三元正態(tài)分布數(shù)據(jù)的拒絕比例。表9 (三元正態(tài)分布)模擬次數(shù):5000次