
64
數(shù)理統(tǒng)計(jì)與管理 第25卷 第5期 2005年9月
文章編號(hào):1002—1566(2005)05—0064—04
經(jīng)典的用回歸模型進(jìn)行統(tǒng)計(jì)控制中的問題
孫尚拱,何平平
(北京大學(xué)衛(wèi)生統(tǒng)計(jì)教研室,北京,100083)
摘要:利用回歸模型進(jìn)行統(tǒng)計(jì)控制,在實(shí)際工作中一直得到廣泛應(yīng)用。通常采用的方法是利用回
^^
=a+bx進(jìn)行逆估計(jì),-a)歸模型y即根據(jù)回歸模型的變換x=(y/b,由應(yīng)變量Y的取值范圍反推
自變量
X的取值范圍。本文指出這種方法是很不合理的;進(jìn)一步提出二種相對(duì)合理取代的統(tǒng)計(jì)方
法。
關(guān)鍵詞:回歸模型;統(tǒng)計(jì)控制
中圖分類號(hào):
O212文獻(xiàn)標(biāo)識(shí)碼:A
ProblemofTraditionalStatisticalControlinRegressionModel
SUNShang-gong,HEPing-ping
(DepartmentofHealthStatistical,PekingUniversity100083)
Abstract:Statisticalcontrolinregressionmodelhasbeenappliedwidelyinpractice.Itisanusualmethodtoestimate
^^
=a+bx.Thatistosay,accordingtotheinverformofregressionmodelx=-reverlyinregressionmodel(
yy
a)/b,wecandeducetherangeofindependentvariableXfromtherangeofdependentvariableY.Butthemethodis
notlogicalinstatistics.Thearticleoppugnsthemethodoftraditionalstatisticalcontrolbytheoryofandfurnishtwo
methodstosubstitutetraditionalmethod.
Keywords:regressionmodel;statisticalcontrol
回歸模型的應(yīng)用中有兩個(gè)方面:統(tǒng)計(jì)預(yù)測(cè)(statisticalforecast)和統(tǒng)計(jì)控制(statisticalcon-
^
=a+bx,trol)。所謂預(yù)測(cè)就是根據(jù)回歸模型y把自變量x代入回歸模型對(duì)應(yīng)變量Y進(jìn)行估計(jì),
其波動(dòng)范圍可按求個(gè)體Y值置信區(qū)間方法計(jì)算。統(tǒng)計(jì)控制則正好與此相反。統(tǒng)計(jì)控制中的
^
-a)常用方法是利用回歸模型進(jìn)行逆估計(jì),即根據(jù)回歸模型的變換x=(/b,由應(yīng)變量y的取
y
值范圍反推自變量
x的取值范圍。
[1][,2][,3][,4]
。本文對(duì)傳統(tǒng)的利用回
目前國(guó)內(nèi)外文獻(xiàn)及書籍中,基本上都是上述的逆推理法
歸模型進(jìn)行統(tǒng)計(jì)控制的理論提出質(zhì)疑;通過實(shí)例,說明了傳統(tǒng)方法在理論及實(shí)用中都是不妥的。
1 用回歸模型的逆推理做統(tǒng)計(jì)控制存在理論上的問題
記應(yīng)變量
Y對(duì)自變量X的直線回歸模型為
^
=a+bxy(1)
解出
^
-a)x=(y/b(2)
今要求應(yīng)變量Y只能在給定的范圍內(nèi)波動(dòng),試求自變量X的取值范圍。經(jīng)典做法:由(1)
收稿日期:2004年03月10日
孫尚拱,何平平:經(jīng)典的用回歸模型進(jìn)行統(tǒng)計(jì)控制中的問題
^
,把應(yīng)變量Y的取值范圍代入(2)中的y再反推自變量X的取值范圍。
[5]
實(shí)例分析
65
美國(guó)某家醫(yī)院為了預(yù)測(cè)低出生體重(出生體重2500g),現(xiàn)收集一組數(shù)據(jù)用于建立預(yù)報(bào)
≤
公式。測(cè)量31名臨產(chǎn)孕婦的尿中雌三醇濃度(Estriol,mm/24hr)以及此后出生的嬰兒體重
(Birthwei,單位:g/100)。測(cè)得數(shù)據(jù)如下:
雌三醇濃度(mm/24hr):
7 9 9 12 14 16 16 14 16 16 17 19 21 24 15 16 17 25 27 15 15
15 16 19 18 17 18 20 22 25 24
出生體重(g/100,與上順序?qū)?yīng)):
25 25 25 27 27 27 24 30 30 31 30 31 30 28 32 32 32 32 34 34
34 35 35 34 35 36 37 38 40 39 43
問題:雌三醇濃度取何值,能預(yù)測(cè)臨產(chǎn)孕婦將會(huì)有低出生體重的嬰兒?
根據(jù)傳統(tǒng)的方法是以
Estriol為自變量(x),Birthwei為應(yīng)變量(y),建立線性回歸模型:
Birthwei的估計(jì)值=21.523+0.608×Estriol(3)
-
殘差標(biāo)準(zhǔn)差s=3.8211,lxx=677.42,x=17.2258。
e
把Birthwei=25代入回歸模型(3)式,得
25=21.523+0.608×Estriol
解得 雌三醇濃度值為
Esriol=5.7178(mm/24hr)
一般預(yù)測(cè)法就是:當(dāng)孕婦尿中雌三醇濃度
≤
5.7178mm/24hr時(shí),就預(yù)測(cè)出生嬰兒體重會(huì)低于
2500g。
問題:(1)如上述問題中的y是正態(tài)隨機(jī)變量(單純的擬合時(shí),回歸問題可用于非隨機(jī)變
量)時(shí),上結(jié)果能給出把握度(概率)嗎?一般是沒有也不考慮的。如果考察概率,我想,按回
歸理論應(yīng)計(jì)算
Estriol=5.7178(mm/24hr)時(shí)應(yīng)變量Birthwei的置信區(qū)間,即根據(jù)下面公式估計(jì)
Birthwei(y)的95%置信區(qū)間(雙側(cè)):
0
^^^
031-200exx0
±t))=s( 其中(1+1/n+(x-x)/l
yyy
根據(jù)此公式,Estriol=5.7178(mm/24hr)時(shí)Birthwei的95%置信區(qū)間為:
2
25±2.045×3.8211+1/31+(5.7178-17.2258)/677.42=(16.3418,33,6582)
ヘ
此結(jié)果表明:當(dāng)Estriol>5.7178(mm/24hr)時(shí),Birthwei值低于2500克的機(jī)會(huì)近似于50%,換
2
ヘ
Birthwei值高于是2500克的機(jī)會(huì)也只有50%!此結(jié)果對(duì)于預(yù)測(cè)低出生體重能有什么句話說,
實(shí)際意義?
問題(
2)上述的逆推理法求自變量(x)的值合理嗎?即我們能否把回歸公式當(dāng)作普通的數(shù)學(xué)
^
=a+bx中,自然的有2=3-1那樣逆推?答案應(yīng)是否定的。理由是1+2=3,
y式子:比如
2
^
ii
)(a,b)是按下述代數(shù)學(xué)原理求出: (y-y=min
Σ
注意此公式僅考慮‘用x去擬合y’,而不是同時(shí)擬合(x,y)。也就是說,回歸公式的使用只能
是單向的,它不應(yīng)該當(dāng)作‘1+2=3,自然的2=3-1’那樣的可以雙向使用!
2 合理的統(tǒng)計(jì)方法
根據(jù)回歸理論,上述實(shí)例應(yīng)把Estriol作為應(yīng)變量(仍記x),而以Birthwei為自變量(仍記
66
數(shù)理統(tǒng)計(jì)與管理 第25卷 第5期 2005年9月
作y),從而且建立線性回歸模型。由上數(shù)據(jù)可得:
Estriol=-2.335+0.611×Birthwei,(4)
殘差標(biāo)準(zhǔn)差
s=3.8308,
e
Birthwei,均數(shù)(y)=32
Birthwei,的l=674
yy
當(dāng)Birthwei=25時(shí),Estriol的估計(jì)值為
Estriol=-2.335+0.611×25=12.940(單位)(5)
^
0
)Estriol=12.940(單位)的(為:
x
^
0e0yy
)=s(x1+1/n+(y-y)/L=3.83081+1/31+(25-32)/674=4.0268
Estriol=12.940(單位)的95%下側(cè)臨界值為
ヘ
ヘ
12.940-t×4.0268=12.940-1.699×4.0268=6.098
0.05(單)
即如Estriol正態(tài)性成立,則Estriol<6.098時(shí),僅有5%的概率認(rèn)為孕婦將出生“低體重”的嬰兒。
3 另一統(tǒng)計(jì)方法
上法中的一個(gè)統(tǒng)計(jì)理論問題:當(dāng)x不是隨機(jī)時(shí)(比如,x=每畝化肥量,y=每畝作物產(chǎn)
量),公式(
4)似乎不合理。但應(yīng)注意:公式(3)及(4)都是代數(shù)學(xué)中的數(shù)據(jù)擬合,它們根本沒
有涉及變量的‘隨機(jī)分布’!隨機(jī)性是僅當(dāng)要求找出‘概率及置信區(qū)間’時(shí)才有要求。如果x
不是隨機(jī)而y是正態(tài),要求只能由(4)出發(fā)而計(jì)算結(jié)論的概率時(shí),可以從下面不等式中求待估
^
00
的95%區(qū)間的下限為:x:利用yy
的下限
≥
a+bx-ts1++=y(5)
0n-2e0
22
^^
00
的95%區(qū)間的上限為利用yy的95%區(qū)間的上限為利用y<y
≤
cx+cx+c=0(6)
10203
2
上兩式都化簡(jiǎn)變?yōu)橥皇角蟾?/span> lb2ll xxxxxx 2 n+1 22 其中l c=。=-1,c=(a-y)b+2x,c=(a-y)-x- 12030xx 222 n (ts)(ts)(ts) eee 此例中 y=25,t=1.699,s=3.8211,l=677.42,x=17.2258, 0n-2exx a=21.523,b=0.608,n=31 代(6),可解得:x=-9.7904(單位),x=-16.5706(單位)。x=-9.7904(單位),x= 01020101 -9 .790對(duì)應(yīng)于單側(cè)下限,負(fù)數(shù)是明顯的不合理。說明本文的實(shí)例如從(3)出發(fā)求95%下限 是不存在的。 4 一個(gè)嚴(yán)重的問題 利用回歸模型做逆推理從而找出需要控制的閾值,在國(guó)內(nèi)外的實(shí)際工作中一直得到非常 廣泛的應(yīng)用。但從本文可見,目前國(guó)內(nèi)外對(duì)于統(tǒng)計(jì)控制的應(yīng)用,普遍存在有誤區(qū)。問題的嚴(yán)重 性在于國(guó)內(nèi)外一直都在用( 3)的逆推法制定世界及國(guó)內(nèi)的食物營(yíng)養(yǎng)、藥品、毒品、環(huán)境及各種 標(biāo)準(zhǔn)!而由上討論可見,已有的標(biāo)準(zhǔn)是多么的錯(cuò)誤! ヘ 2 1 (x-x) 0 nl xx 孫尚拱,何平平:經(jīng)典的用回歸模型進(jìn)行統(tǒng)計(jì)控制中的問題 [參考文獻(xiàn)] [1] BernardRosner.FundamentalsofBiostatistics,5editionBrooks,2000. th [2] 劉定遠(yuǎn).醫(yī)藥數(shù)理統(tǒng)計(jì)方法[M].北京:人民衛(wèi)生出版社,1999. [3] 倪宗贊.衛(wèi)生統(tǒng)計(jì)學(xué)(第四版)[M].北京:人民衛(wèi)生出版社,2000. [4] 胡健穎,馮泰.實(shí)用統(tǒng)計(jì)學(xué)[M].北京:北京大學(xué)出版社,1999. [5] 孫尚拱譯.生物統(tǒng)計(jì)學(xué)基礎(chǔ).[M].北京:科學(xué)出版社,2004. 67 (上接第49頁(yè)) [參考文獻(xiàn)] [1] 方開泰.均勻設(shè)計(jì)[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),1980,3:363-372. [2] 方開泰.均勻設(shè)計(jì)及其應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,1994,13:57-63. [3] 方開泰.均勻設(shè)計(jì)與均勻設(shè)計(jì)表[M].北京:科學(xué)出版社,1994. [4] 方開泰、馬長(zhǎng)興.正交與均勻試驗(yàn)設(shè)計(jì)[M].北京:科學(xué)出版社,2001. [5] 方開泰、王元.數(shù)論方法在統(tǒng)計(jì)中的應(yīng)用[M].北京:科學(xué)出版社,1996. [6] 唐啟義.http:(網(wǎng)站).www.statforum.com ∥ [7] 唐啟義、馮明光.實(shí)用統(tǒng)計(jì)分析及其DPS數(shù)據(jù)處理系統(tǒng)[M].北京:科學(xué)出版社,2002. [8] 王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,1999. [9] 張承恩.http:(網(wǎng)站).ust40.html.533.net ∥ (上接第59頁(yè)) [參考文獻(xiàn)] [1] 范金城(FanJincheng)等,統(tǒng)計(jì)推斷引論[M].科學(xué)出版社,2001.8:203-209. [2] 汪峰,于爾鏗,閆承山等.基于因素影響的電力系統(tǒng)短期負(fù)荷預(yù)報(bào)方法的研究[J].中國(guó)電機(jī)工程學(xué)報(bào), 1999,19(8):54-58. [3] 何曉群等.應(yīng)用回歸分析[M].中國(guó)人民大學(xué)出版社,2002.9.

本文發(fā)布于:2023-05-25 13:07:33,感謝您對(duì)本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/zhishi/a/1684991254178088.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請(qǐng)勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:用經(jīng)典的回歸模型進(jìn)行統(tǒng)計(jì)控制的問題.doc
本文 PDF 下載地址:用經(jīng)典的回歸模型進(jìn)行統(tǒng)計(jì)控制的問題.pdf
| 留言與評(píng)論(共有 0 條評(píng)論) |