怎样解读正态分布p值计算公式性检验中P值

查看: 3375|回复: 4
正态性检验中P值的含义
TA的每日心情开心 11:30签到天数: 136 天[LV.7]天山茗客主题帖子积分
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
才可以下载或查看,没有帐号?
简单说P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较.
但是不管用那个方法原理都是基本一致的,要注意的是落在拒绝域是基本可以肯定的结果,反之则不能得到完全肯定的结论.- x2 B$ L&&f. ?6 _4 k" A&&X
就拿你的这个问题举例,那么如果p小于0.05我们说可以证明数据不服从正态分布,而如果p大于0.05呢,我们的结论应该是无充分证据证明此分布不服从正态分布或者说不能证明此分布非正态,而你不能得到结论说此分布服从正态分布(如果非要证明分布服从正态分布,我个人觉得可以用回归的理论去研究拟合度).
还有就是再强调一下,这个大家也应该很多人知道,0.05是我们选择的置信度,一般情况我们认为小于5%为小概率事件,所以比这个几率小的事件我们认为在一次实验中不会发生,当然我们也可以选2.5%\1%(这就是对两类错误的讨论了)
6 ?% W, r4 Y, Z/ L! \3 _3 L
开心每一天!
TA的每日心情开心 11:30签到天数: 136 天[LV.7]天山茗客主题帖子积分
A.用SAS软件检验正态性:" t&&Y: ?. b8 s# W4 [
$ k6 l( v3 c% f7 s
(Ⅰ)正规的正态性检验可以通过PROC UNIVARIATE中的选择项NORMAL来实现。输出结果包括6部分。其中第4部分输出正态检验结果:- c2 p6 A7 j&&C- R- l&&Z( x
当样本数N&2000时,shapiro-wilk的W统计量检验正态性;- o' R9 @! F$ u2 h" O
当样本数N&2000时,Kolmogorov-Smirnov的D统计量检验正态性;检验时,根据样本计算一个统计量即检验统计量D。它把样本分布的形状和正态分布相比较,比较得出一个数值p(0&p&1,即实际的显著性水平)来描述对这个想法的怀疑程度。如果p值小于0.05(给定的显著性水平),则原假定非常可疑,认为数据不是来自正态分布,反之则认为数据来自正态分布。
% o& P1 i5 \3 I% M% o
(Ⅱ)附加检验之一,观察正态概率图,如果数据来自正态分布,图形的散点应该呈现一条直线。用Plot绘制正态分布的概率图,里面的“+”构成一条直线(正态分布数据概率图散点应该成一条直线),“*”代表样本数据散点。根据“*”覆盖 “+”的程度,说明样本数据是否来自正态分布数据。
6 Y$ R" T$ U2 x# a, e$ b
(Ⅲ)附加检验之二,绘制数据的条形图,如果数据来自正态分布,条形图呈现“钟形”分布。用histogram绘制直方图/normal在直方图中拟合正态分布的密度曲线,可以看到,曲线几乎是个标准钟形,可以认为数据是正态分布。
(Ⅳ)附加检验之三,观察描述性统计量中偏度系数(Skewness)g1和峰度系数(Kurtosis)g2,如果数据来自正态分布,则两者都应该是0(适合大样本,仅当N&30时才有效)。用g1,g2,бg1,бg2来计算U值,用U检验法。U1= 同理计算U2,要两个都小于1.96,即p大于0.05才可以。
(Ⅳ)附加检验之四,茎叶图(适合小样本)
B.SPSS检验正态性:
& &(1)P-P图:正态概率分布图" B' `& J! v0 M# _
(2)Q-Q图:正态概率单位分布图
上述两种图形可判断数据服从什么分布类型。, E% A1 C3 K" W. J* i
(3)K-S检验。
* U& b" ?9 c& {$ H
开心每一天!
TA的每日心情奋斗 12:57签到天数: 111 天[LV.6]听雨闲人主题帖子积分
工程师II, 积分 2006, 距离下一级还需 994 积分
工程师II, 积分 2006, 距离下一级还需 994 积分
TA的每日心情奋斗 12:57签到天数: 111 天[LV.6]听雨闲人主题帖子积分
工程师II, 积分 2006, 距离下一级还需 994 积分
工程师II, 积分 2006, 距离下一级还需 994 积分
TA的每日心情慵懒 14:26签到天数: 247 天[LV.8]求真使者主题帖子积分
五周年纪念
中国质量俱乐部五周年纪念勋章
在论坛就任版主的均可获得此勋章
Powered by您的赞赏,是对我创作的最大鼓励。|赞赏
收藏已收藏 | 29赞 | 3
分享到微信扫码分享到微信
吆喝科技,AB测试云服务。
21篇作品102.6k阅读总量
热门问题12345678910数据正态性检验画图的4种方法
数据正态性检验画图的4种方法
由于有人问如何使用R进行数据正态性检验,所以周老师干脆写个主题帖解释一下。如果恰好解决了你的问题,请读完后给个好评哟~正态性检验,是很多数据分析前要做的准备性工作。例如,你有组数量性状的表型值,你想先判断其是否符合正态分布,再开展后续的数据分析。最简单的检验方法正态性检验,最简单的方法是使用R语言的shapiro.test命令。如果P value > 5%,则说明数据分布近似正态分布。图形化的比较当然,你还期望有图形化的比较,以便在文章中展示。那么有4种画法。1QQ-plot分位数图功能和原理:检验样本的概率分布是否服从某种理论分布。PP概率图的原理是检验实际累积概率分布与理论累积概率分布是否吻合,若吻合,则散点应围绕在一条直线周围,或者实际概率与理论概率之差分布在对称于以0为水平轴的带内。QQ概率图的原理是检验实际分位数与理论分位数之差分布是否吻合,若吻合,则散点应围绕在一条直线周围,或者实际分位数与理论分位数之差分布在对称于以0为水平轴的带内。QQ概率图以样本的分位数为横轴,以指定理论分布的分位数为纵轴绘制散点图。#install.packages('DAAG')library(DAAG)data(possum)attach(possum) &# 数据准备fpossum # 只分析这些样本中的雌性个体x#将totlngth这个表型均一化,即 标准正态化n plot(qnorm((1:n-0.5)/n),sort(x),col=2,type = 'p',main = 'QQ plot',xlab='Theoretical Quantiles',ylab='Studentized Quantiles' )abline(a=0,b=1,lty=3)图形表示,数据与正态性略有差异,特别是中部区域。2与正态密度函数直接比较library(DAAG)data(possum)attach(possum)fpossum dens xlim ylim mean = mean(totlngth)sd = sd(totlngth)par(mfrow=c(1,2))hist(totlngth,& & breaks=72.5+(0:5)*5,& & xlim = xlim ,& & ylim = ylim ,& & probability = T ,& & xlab = 'total length',& & main = 'A:Breaks at 72.5...')lines(dens,& & & &col = par('fg'),& & & &lty = 2)curve( dnorm(x, mean, sd),& & & & &col = 'red',& & & & &add = T)hist(totlngth,& & & &breaks = 75 + (0:5) * 5 ,& & & &xlim = xlim,& & & &ylim = ylim,& & & &probability = T,& & & &xlab='total length',& & & &main = 'B:Breaks at 75')lines(dens,& & & &col = par('fg'),& & & &lty = 2)curve(dnorm(x,mean,sd),& & & &col = 'red',& & & &add = T)看图直接看和正态密度函数的差异度。这张图在数量性状的文章里最常出现。3经验分布与正态分布函数对比library(DAAG)data(possum)attach(possum)fpossum mean = mean(totlngth)sd = sd(totlngth)x n y plot(x,y,& & & &type = 's',& & & &main = 'Empirical CDF of ')curve(pnorm(x, mean, sd),& & & &col = 'red',& & & &lwd = 2,& & & &add = T)4P-P plot图使用p value画图,常用于比较GWAS分析结果中,观测的P value和理论p value间的差异,代码大概如下:r=read.table('temp_name.txt')& && &# 含位点p值的文件。一行1个位点,p值在第六列;o=-log10(sort(r$V6,decreasing=F))&&# 观测到的p值,对p value列排序,假设p value在第六列e=-log10(ppoints(length(r$V6)))& & # 生成对应的平均分布的p值,为期望值;plot(e,o,pch=20,xlab='Expected~-log10(p)',ylab='Observed~-log10(p)',main='QQ plot',col= 'blue',xlim=c(0,max(e)+0.1),ylim=c(0,max(o)+0.1),bty= 'l ',yaxs= 'i ',xaxs= 'i ',cex=2)&abline(0,1,col= 'red ')#结果如下4种图形化展示方式不知道你心水哪种呢?可以都拿走噢~哈哈~明天见~
发表评论:
TA的最新馆藏人人网 - 抱歉
哦,抱歉,好像看不到了
现在你可以:
看看其它好友写了什么
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&在p值检验中如何根据样本数据求出p值呢?我是先算出z值然后查正态分布表,但结果和课本不一样.麻烦您教一下.
这个要看是单侧检验还是双侧检验.记检验统计量为Z,其观测值(依据样本算出的Z值)为z0,当拒绝域的形式为W={Z>z_(1-α)}(单侧检验的一种情形,这里z_(1-α)表示标准正态的下侧1-α分位数)时,则这时检验的p值为 p=P{Z>z0}=1-P{Z≤z0}=1-Φ(z0).当拒绝域的形式为W={|Z|>z_(1-α/2)}(双侧检验的情形)时,则这时检验的p值为 p=P{|Z|>|z0|}=1-P{|Z|≤|z0|}=2-2Φ(|z0|).另外,还要注意检验时不是正态检验,如果是T检验或是F检验又或者是其他的什么检验的话,那就需要根据相应的分布来查对应的p值了.
为您推荐:
其他类似问题
扫描下载二维码

我要回帖

更多关于 正态性检验p值 的文章

 

随机推荐