小中大正交设计分析(希望大家有所收获)
正交设计分析
在前面的帖子中(非常实用且简单易懂的正交实验方法)已经对正交设计中常用的术语−−−−指标、因子和水平 进行了详细的阐述,并且
合理的利用例子对正交设计分析程序----因子最佳水平的确定、因子重要性分析、因子显著性的检验、确定最佳方案等进行了诠释,如果还有不
懂的网友可以发帖讨论前面所讨论的内容,在接下来的讲解中,我会把前面的内容进行简单的总结,希望对理解不是很深刻的网友有一定的帮助!
本帖子的重点是讲述如何用正交误差分析和方差分析去识破中文期刊中大量造假论文??? 很多网友以为在吹牛,大家不要忘了,世界上任何事情
都是互补的,有其完善的一面,也有其有机可乘的一面,简单的说,任何事情都有两面性( Every coin has two sides ! ).
学习才是硬道理,我们一起来学习吧,一起来享受吧!!!
(一)、首先回顾有关因子最佳水平的确定、因子重要性分析、因子显著性的检验、确定最佳方案的基本知识
1 正交设计分析程序
正交设计分析是从正交表的试验数据出发来分析各因子水平对指标的影响,从而确定最佳组合方案的过程。其分析程序如图9.1.1。对上例经初步分析可得表9.1.5。
表9.1.5
水 列
平
号
试验号 A(树高) B(带宽) C
(主要树种) D 效益
(百元/亩)
yi
1 10 5 阔 Y1=1.72
2 10 10 针 Y2=1.82
3 10 15 混 Y3=1.80
4 15 5 阔 Y4=1.92
5 15 10 针 Y5=1.83
6 15 15 混 Y6=1.98
7 20 5 阔 Y7=1.59
8 20 10 针 Y8=1.60
9 20 15 混 Y9=1.81
M1 M11=5.34 M12=5.23 M13=5.30 M14=5.36
M2 M21=5.73 M22=5.25 M23=5.55 M24=5.39
M3 M31=5.00 M32=5.59 M33=5.22 M34=5.32
=1.78
=1.743 =1.767 =1.787
=1.91
=1.750 =1.850 =1.797
=1.69
=1.863 =1.740 =1.773
极差R1 R1=0.72 R2=0.36 R3=0.33 R4=0.07
方差S1 S1=0.08896 S2=0.02729 S3=0.01976 S4=0.00082 S总=0.13682
表中数据Mij、Yij、Rj、Sj是在表9.1.4试验数据的基础上分析得到的。
现以城市绿化系统经济效益试验和调查的资料为例说明正交设计的分析过程和原理。
2 正交设计分析
正交设计中常用的术语有:指标、因子和水平。
正交设计把试验设计要考虑的结果和评价准则称为指标,一般以yi表示第i次试验的指标值,表示总平均指标;把对试验结果和对评价指标可能产生影响且在试验中明确了条件加以对比的因素称为因子,一般以大写字母表示;把每个因子在试验中的具体条件称为因子的水平,简称水平,一般以表示因子的大写字母加上脚标来表示。
如在研究城市绿化系统经济效益的时候,需要确定最佳城防林营造方案。据资料分析,影响城防林经济效益的因素有(1)树高;(2)林带宽;(3)树种组成。现需通过调查或试验确定该三个因素是否都对城防林经济效益有显著影响、它们怎样组合才能使所营造的城防林经济效益最佳。选择的试验或调查条件为:树高:10m、15m、20m;林带宽:5m、10m、15m;树种组成:纯阔叶林、纯针叶林、针阔混交林。在这种情况下,城防林经济效益的大小就是指标;树高、林带宽、树种组成为因子;树高的三个条件:10m、15m、20m为该因子的三个水平;林带宽的试验条件:5m、10m、15m为该因子的三个水平;树种组成的三种情况:纯阔叶林、纯针叶林、针阔混交林为该因子的三个水平。
1、 因子最佳水平的确定
因子最佳水平是指每个因子的各水平中使指标达最佳的水平。为确定因子的最佳水平,必须确定该因子各水平对指标的影响。为了排除其他因子的影响,采用分类的方法。如确定树高因子的最佳水平,可将九次试验分为三组,分组情况见表9.1.6。
表9.1.6
因素
试验号 A B C 效益平均值
1、2、3 全为A1(10m) B1、B2、B3各一次 C1、C2、C3各一次 =1.78
4、5、6 全为A2(15m) B1、B2、B3各一次 C1、C2、C3各一次 =1.91
7、8、9 全为A3(20m) B1、B2、B3各一次 C1、C2、C3各一次 =1.69
由表可见,这三组试验数据体现了树高因子(A)对指标的影响,而排除了林带宽和树种组成的影响,这是由于林带宽和树种组成对树高各种水平的影响均相等的缘故。
设第i次试验的指标值为Yi,第K因子第J水平的指标平均值为 ,第k因子的水平数为Wk,则:
j=1,2,……,wj (9.1.1)
式中:Mjk为k因子j水平的指标合计值,Mjk= 。
表9.1.7 各因子各水平的指标平均值
指 因
标
平 子
均
各水平 值
平均值 A B C D
=1.78
=1.743
=1.764
=1.787
=1.91
=1.75
=1.850
=1.797
=1.667
=1.863
=1.740
=1.773
由表可见,表中每列的最大值即是对应最佳水平的指标平均值。
2、 因子重要性分析
各因子对指标的影响是不同的,其重要性也各不相同。为了评价各因子的重要性,需拟定一评价指标。通常采用离差平方S和或极差R作为评价指标。
由表9.1.7中每列的数字可见,各数据间的差距越大,说明该因子各水平相差悬殊,对指标的影响大,反之则小。因此以离差平方和或极差可粗略的揭示出各因子的重要性。
计算k因子离差平方和时需考虑其水平数,其计算公式为:
(k=1,2,…) (9.1.2)
其中: Sk——k因子的离差平方和;
Wk——因子的水平数;
——总平均指标值, 。
k因子的极差按下式计算:
Rk=max{Mjk}-min{Mjk} (9.1.3)
式中Mjk为k因子j水平的指标合计值;