实验设计与分析(一)3_第1页
实验设计与分析(一)3_第2页
实验设计与分析(一)3_第3页
实验设计与分析(一)3_第4页
实验设计与分析(一)3_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验设计与分析(一) 【美】Douglas C. Montgomery,许荣浩 2015.12.21,教材,“这是实验设计领域最权威的一本书,全面、透彻而且非常实用”,一、实验设计 二、实验设计应用 三、基本原理 四、实验设计指南 五、统计设计实简史,一、实验设计,实验 试验,我们可以定义一次实验(experiment)是一次试验(test)或一系列试验,在实验中通过对某一过程或系统的输入变量作一些有目的的改变,以便能够观测到和识别出可在输出响应中观测到的变化的缘由。,实验包括新产品设计和配方、制造过程(process)开发以及过程改进在内的产品实验(product realization)中

2、起着重要的作用。多数情况下是为了开发一种稳健的(robust)过程,即受外部变异性来源影响最小的过程。,DOE:即实验设计(Design of Experimental)是对实验方案进行优化设计、以降低实验误差和生产费用,减少实验工作量并对实验结果进行科学分析的一种科学研究方法;是一种籍用实验的手段来决定最佳设计或生产的方法。 Minitab软件:是为DOE、质量改善、教育和研究应用领域提供统计软件和服务的先导。Minitab被许多世界一流的公司和四千多所院校所采用。,可控制的因子(输入变量),不可控制的因子(输入变量),因子的来源考虑:因果图(鱼骨图),FMEA,柏拉图,头脑风暴法,鱼骨图,

3、鱼骨图,实验设计的意义,为什么需要实验设计?,相同原料,相同过程,为什么良品率不一样?,更便宜的原料,相同产品相同功能,为什么可以做出低成本高质量的产品?,实验设计的作用,实验目的,实验目的包括: 1、确定哪些变量对响应y的影响最大; 2、确定有影响的x设置为何值可使y几乎接近于所希望的额定值; 3、确定有影响的x设置为何值可使得y的变异性较小 4、确定有影响的x设置为何值可使得不可控制的变量z1,z2,zq的效应最小。,实验往往包括几个因子。通常进行实验的人的目的,就是要确定这些因子对系统的输出响应的影响。设计和进行实验的一般方法称作实验策略。实验者可以采取多个策略。,DOE分类,实验设计(

4、DOE)的分类 1、筛选实验(单因子实验设计) 2、全因子实验设计(析因实验设计,全面实验) 3、部分因子实验设计(分式析因实验,包含正交实验) 4、响应曲面设计 5、混料设计 6、田口设计,实验与模型,机理模型(mechanistic model),电路中关于电流的著名公式,即欧姆定律:E=IR。,经验模型(empirical model),由实验决定的模型,科学和工程的大多数都是对系统的运行进行观测和实验,从而阐明系统运行的原因和方式。,案例:高尔夫球,高尔夫球规则:从发球区开始经一次击球或连续击球将球打入洞内,将每一洞的杆数累计起来,待打完一场(十八洞)后,把全部杆数加起来,以总杆数最少

5、者胜。 有些因子会影响高尔夫得分,包括: 1、使用的长打棒的类型(特大尺寸的还是常规尺寸的) 2、使用的球的类型(树胶的还是三片的) 3、步行并手提高尔夫球棒还是乘高尔夫球车 4、打球时喝的是水还是啤酒 5、在上午打球还是在下午打球 6、打球时天气是冷还是热 7、高尔夫球鞋钉的类型(金属的还是软的) 8、在有风的日子还是无风的日子打球,最佳猜测法,最佳猜测法(best-guess approach)就是选择这些因子的任意组合,测试它们,观测发生了什么。例如,选择使用特大长打棒、橡胶球、乘高尔夫球车和喝水的组合,结果为87杆。但是在这一轮中,注意到使用特大长打棒有几杆进球结果并不好,因此决定在另

6、一轮中使用常规长打棒,其他因子保持不变。基于目前试验的结果,下次试验改变一个(或两个)因子的水平,这种方法可以几乎无限期地继续下去。 这种试验策略在实践中经常被工程师和科学家所采用。因为实验者具有大量关于他们正研究的系统的技术上或理论上的知识,还有相当丰富的实际经验,所以该方法的使用效果通常相当好。,最佳猜测法,但是最佳猜测法至少有两点不足。 第一,假定最初的最佳猜测没有产生预期的结果,实验者不得不做另一种关于因子水平正确组合的猜想,这要继续很长一段时间,而且没有成功的保证。 第二,假定最初的最佳猜测产生了一个可以接受的结果,现在虽然不能保证最优解决办法已被发现,但实验者仍试图终止实验。,一次

7、一因子方法,一次一因子(one-factor-at-a-time)方法 包括对每个因子选择初始点,或者水平的初始(baseline)组合,然后在保持其他因子在初始水平不变的条件下(特大长打棒、树胶球、步行和喝水作为4个因子的初始水平),让每一个因子在其所允许的范围内进行连续变动。当所有的试验都做完后,我们就可以做出一系列的图形,来显示响应变量如何受单个因子变化(即保持其他因子不变)的影响。,一次一因子法,例如,行进模式曲线的斜率是负的,我们可以得出乘车有助于提高成绩的结论。根据这些一次一因子图形,我们选择的最优组合是常规长打棒、乘车和喝水。高尔夫球的类型似乎并不重要。,一次一因子法,一次一因子

8、策略的主要缺点在于,它没有考虑因子间可能存在的交互作用(interaction)。交互作用会使一个因子与另一个因子的不同水平结合使用难以对响应产生同样的效应。,图1.3说明了高尔夫实验中长打棒的类型和饮料因子之间的交互作用。可以看出,如果我使用常规长打棒,所喝的饮料类型对得分几乎没有影响,但是如果我使用特大长打棒,喝水的效果比喝啤酒的效果更好。,一次一因子法,因子间的交互作用是非常普遍的,如果交互作用存在,那么一次一因子的策略产生的结果往往不理想。许多人没有意识到这一点,结果在实际中经常采用一次一因子实验。(有些人确实认为这个策略是一种科学方法,或者认为它“合乎”工程原理。)然而对设计而言,一

9、次一因子实验往往比其他基于统计途径的方法效率更低。,析因实验,处理多个因子的正确方法是进行 这种实验策略是所有因子一起变化,而不是一次变一个。 全面实验,析因试验(factorial experiment),析因实验(高尔夫实验),这样的实验设计可以帮助实验者研究每个因子的个体效应(或主效应)并判定因子是否存在交互作用。,析因实验,因为我希望打8轮高尔夫球来检测这些因子,所以图1.4中显示的每个因子水平组合可以各打2轮。实验设计者称之为重复设计两次。 图1.5a显示了执行图1.4中的析因实验的结果。在正方形的4个角点上显示了每一轮高尔夫得分。,析因实验,球棒效应与球的类型4个角的数据分别为(8

10、8,91),(92,94),(88,90),(93,91),析因实验,这个简单的例子显现出析因实验的一个非常重要的特性,即析因实验可以高效率地利用实验数据。注意到这组实验包括8个观测值,所有观测值都用于计算长打棒、球和交互作用的效应。没有其他的实验策略可以这样高效率地利用数据,这是析因实验一个重要且有用的特性。,析因实验,可以将析因实验的概念推广到3个因子。假定希望研究长打棒类型、球类型以及饮料类型对高尔夫得分的效应,并且假定这3个因子都有两个水平,析因实验的设计可以如图1.6所示。注意到各有两个水平的3个因子有8个试验组合,8个试验点可以在几何上用立方体的8个顶点来表示。这是一个23析因设计

11、的例子。,析因实验,图1.7显示了如何在24析因设计中研究所有的4个因子长打棒、球、饮料和行进方式(步行或乘车)。像在任意的析因设计中一样,它利用了因子水平组合的所有可能。由于所有4个因子都有两个水平,所以这个实验设计在几何上仍然可以用立方体(实际上是超立方体)表示。,分式析因实验(正交实验),一般地,如果有k个因子,每个因子有两个水平,那么析因设计就要进行2k轮。例如,图1.7中的实验要进行16轮。显然,随着感兴趣的因子数的增加,要求的轮数也迅速增加。比如,具有10个因子、每个因子都有两个水平的实验需要进行1024轮。这无论从时间还是资源角度来说都是不可行的。 所幸的是,如果有45个甚至更多

12、的因子,通常没有必要对因子水平所有可能的组合一一进行试验。分式析因实验(fractional factorial experiment)是基本的析因设计的变形,它只对所有组合的一个子集进行试验。,分式析因实验(包含正交实验),图1.8显示了高尔夫实验中4个因子的一个分式析因设计。这个实验只需要做8轮而不是原来要求的16轮,因此称作1/2分式(one-half fraction)。 它提供了很好的关于4个因子主效应的信息以及因子间如何交互的部分信息,正交实验,正交试验设计就是安排多因素试验 、寻求最优水平组合 的一种高效率试验设计方法。用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面

13、试验的情况。,表10-1,正交实验,正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图10-1中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。,正交实验,正交实验,正交实验的代表性 一方面: (1)任一列的各水平都出现,使得部分试验中包括了所有因素的所有水平; (2)任两列的所有水平组合都出现,使任意两因素间的试验组合为全面试验。 另一方面: 由于正交表的正交性,正交试验的试验点必然均衡地分布在全面试验点中,具有很强的代表性。因此,部分试验寻找的最优条件与全面试验所找的最优条件,应有一致的趋势。,正交实验

14、,正交实验的综合可比性 (1)任一列的各水平出现的次数相等;(2)任两列间所有水平组合出现次数相等,使得任一因素各水平的试验条件相同。这就保证了在每列因素各水平的效果中,最大限度地排除了其他因素的干扰。从而可以综合比较该因素不同水平对试验指标的影响情况。 根据以上特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。,正交表的三个基本性质中,正交性是核心,是基础,代表性和综合可比性是正交性的必然结果,响应曲面方法,响应曲面方法(response surface methodology),响应曲面设计,一旦找到了优化区域,一般就要进行另一次实验。第2次实验的目标是开发一个过程的经验模型,并

15、得到一个对时间和温度的最优运行条件的精确估计。这种过程最优化的方法称作响应曲面方法。 图1.9中第2个实验是一个中心复合设计(central composite design),是用在过程优化研究中最重要的实验设计之一。,混料实验,生化工程师要设计一种诊断产品来检测某一种特定疾病是否存在。该产品是生物材料、化学试剂盒其他材料的混合物,当与人的血液混合时发生反应并提供诊断信息。这里使用的实验类型是混料实验(mixture experiment),因为组成诊断产品的各成分在混合物中的比率总和为100%。响应是在产品中出现混合比的函数。混料实验是响应曲面实验的特殊类型,在设计生物科技产品、药品、油漆

16、和涂料以及各种其他产品方面,它们都有很大的用途。,二、正交实验设计应用,单个正交实验的主要步骤: 1、确定实验目的 2、确定评分标准 3、确定因素及水平 4、选择合适的正交表 5、随机化实验 6、结果分析 7、进一步优化 8、验证实验,正交设计优化罗红霉素的处方工艺,罗红霉素不溶于水,对胶囊的溶出度影响较大,胶囊填充流动性不好,影响装量差异。基于以上原因,本课题运用正交设计,采用湿制粒,解决了溶出度问题,正交设计优化罗红霉素的处方工艺,从方差分析看,B因素具有显著性影响,C因素、A因素的影响无显著性意义。直观分析与方差分析基本一致。最终确定最优选处方为A1B3C3。,医药前沿2014年第19期

17、供稿 作者:吴军 陈家香 陈兰 王正凤 李贵香 余春梅(通讯作者)西南药业股份有限公司 重庆,正交实验设计优化氟尿嘧啶植入剂制剂工艺研究,一、因素水平表 对原制剂工艺流程进行分析发现,原料药粒度、原辅料混合转速、混合时间、上冲压力、下冲压力、干燥温度为影响制剂成型的几个关键影响因素,选用L8(27)正交表对影响因素进行初步优化。,徐刚等;中国医药导报2015年7月第12卷第19期;P1933;芜湖先声中人药业有限公司。,由表2、3可知,因素C、D、E(即混合时间、上冲压力和下冲压力)对综合评价结果无显著影响,故在进一步优化改进过程中,采用单因素分析对上述因素进行优化改进;因素A、B、F(即原料

18、药粒度、混合转速及干燥温度)对综合评价结果影响显著,故在进一步优化改进过程中,采用L9(34)正交实验表对上述因素进行进一步的优化改进;同时初步确定优化制剂工艺为A2B2C1D1E1F1,即原料药粒度100目,混合转速500r/min,混合时间为30min,上冲压力7.0mPa,下冲压力6.0mPa,干燥温度60。,二、制剂工艺进一步优化 依据“初步优化制剂工艺”,采用单因素分析进行优化。,1、原辅料混合时间优化,综合分析,选择30min作为最优原辅料混合时间。,3、下冲压力优化,3中条件无显著差异,因此从实际生产成本、效率角度考虑,选择5.0mPa作为最优下冲压力。,2、上冲压力优化,冲压加

19、大可以缩短制剂时间,但是过大冲压会加速冲头的损耗,综合分,选择7.0mPa作为最优上冲压力,4、采用L9(34)正交实验表对原料药粒度、混合转速及干燥温度的优化,因素A(原料药粒度)和因素B(混合转速)对氟尿嘧啶植入剂的含量和制剂时间具有显著性影响(P0.05),因素F(干燥温度)对氟尿嘧啶植入剂的含量和制剂时间无显著性影响,综合直观分析结果,得出最优工艺为A3B2F1,即原料药粒度120目,混合转速为500r/min,干燥温度为60。,三、验证性实验 根据优化出的最优制剂工艺,分别制备3批氟尿嘧啶植入剂样品,考察工艺稳定性及可靠性。,3批产品的含量和制剂时间的RSD值均3%,说明工艺稳定可靠

20、。,三、基本原理,实验的统计设计(statistical design of experiment) 就是设计实验的过程,以便收集适合于用统计方法分析的数据,从而得出有效且客观的结论。 如果想从数据中得出有意义的结论,那么用统计方法作实验设计是必要的。当问题涉及受实验误差影响的数据时,只有统计方法才是客观的(objective)分析方法。因此,任何实验问题就存在两个方面:实验的设计和数据的统计分析。 这两个方面是紧密相连的,因为分析方法直接依赖于所用的设计。,实验设计的3个基本原理: 随机化(randomization) 重复(replication) 区组化(blocking),1、随机化,

21、随机化是实验设计中使用统计方法的基石。 它的意思是,实验材料的分配和实验中各次试验进行的顺序都是随机确定的。统计方法要求观测值(或误差)是独立分布的随机变量。随机化通常能使这一假定有效。 把实验进行适当的随机化有助于“平均掉”可能出现的外来因子的效应。,1、随机化,计算机软件程序经常用于辅助实验者选择和指导实验设计。这些程序经常使实验设计按照随机的顺序执行每一轮。随机顺序可以由一个随机数字发生器产生。但即使有了这样一种计算机程序,仍有必要安排在实验中使用的各种实验材料、操作者和测量装置等。 有时候实验者很难随机化实验的某一部分。例如在化学过程中,温度是非常难以改变的变量,相对于其他因子,我们很

22、少改变它。在这种实验中,完全随机化是非常困难的,因为它需增加时间和费用。我们将采用统计设计方法来处理随机化的限制问题。,2、重复,所谓重复,是指每个因子水平组合的独立重复。在1.1节讨论的冶炼实验中,重复包含用油淬处理试件和用盐水淬处理试件。这样,当在每种淬火介质中处理了5块试件时,我们就说做了5次重复。这10个观测值中的每一个都是按照随机次序进行的。 重复有两条重要的性质。第一,它允许实验者得到一个实验误差估计(偏差),这个误差估计成为了一个确定数据之间的观测差是否统计意义的实际差的基本度量单位。第二,如果用样本均值(y)估计实验中某一因子水平的响应均值的真值,则重复能够使得实验者得到更精确

23、的参数估计(方差)。例如:如果2是单个观测值得方差,且有n次重复,则样本均值的方差是,2、重复,通常在随机化实验中连续两次(或更多次)试验的一些因子会出现完全相同的水平。例如,一个实验中有3个因子:压强、温度和时间。随机化实验次序后,我们发现:,第i次和第i+1次试验中,压强的水平是相同的,而第i+1次和第i+2次试验中,温度和时间的水平是相同的。为了获得真正的重复性,实验者需要在第i次和第i+1次试验中间,“扭动压力旋钮”调到一个中间值,并在第i+1次试验中重新设定压强为30psi。类似地,在第i+1次和i+2次中间,在设定第i+2次试验设计水平之前,先将温度和时间设定在中间水平。,部分实验

24、误差就源自达到和维持因子水平的变异性。,2、重复,重复和重复测量是有很大区别的。例如,假定在一个单晶片等离子体蚀刻工序中蚀刻一个硅晶片,晶片的关键尺寸需测量3次。这种测量不是重复,是重复测量。 重复测量的观测差异受测量系统或量具内在的变异性的直接影响。 重复既反映试验间的变异又反映试验内在的变异。,3、区组化,区组化是用来提高实验精度的一种设计技术,使用它我们在感兴趣的因子之间进行比较。区组化常用于减少或消除讨厌因子带来的变异。讨厌因子是指可能影响实验响应而我们不直接感兴趣的因子。例如,在一个化学过程中,要在所有的轮次中使用两批原材料。然而,由于供货商之间的不同可能造成批次间的差异,如果我们对

25、这种影响不是特别感兴趣,就可以将原材料的批次作为讨厌因子。一般地,区组是一组相对类似地实验条件。在刻画过程的例子中,批次内的变异差异预期小于批次间的变异,所以各个批次的原材料将组成一个区组。一般情况下,正如在该例中一样,讨厌因子的每个水平形成一个区组。实验者在统计设计中将观测值按区组进行分组。,四、设计实验指南,为了在设计和分析实验时使用统计方法,与实验有关的每一个人需要预先对所研究的问题究竟是什么以及如何收集数据等有一个清晰的认识,至少要对如何分析这些数据有一个定性的了解。推荐步骤见表1.1。,1、问题的识别与表述,1、问题的识别与表述 这一点看起来似乎是再明白不过了,但是在实践中,确认需要

26、实验的问题的存在却并不是那么简单的,将问题阐述得简明而又可以被普遍接受就更不简单了。需要对实验目的有一个全面的考虑。通常,吸引所有有关各方的参与是很重要的,其中包括:工程部、质量保证部、制造部、市场营销部、管理部门、顾客以及操作工(通常,他们有很多很好的想法,却常常被忽略了)。基于这个原因,采用团队方法来设计实验是值得推荐的。,1、问题的识别与表述,对实验涉及的有关问题列一个清单往往是有帮助的。明确地陈述问题通常有助于更好地理解正在研究的现象以及问题的最终解决方案。牢记总目标也很重要。例如,它是否一个新的过程或系统(此时初始目标可能是刻画或因子筛选)?它是否一个已经被提前刻画的成熟的或者容易理

27、解得系统(此时目标可能是优化)?一个实验可能有很多目标,包括确认(系统运行的方式是否与以前一样?)、发现(如果我们开发新的材料、变量、运行条件等,将会发生什么?)、稳定性或稳健性(在什么条件下响应变量受因子的影响小,或者我们怎样才能减小我们不能直接控制的来源因其的响应变量的差异?)。,1、问题的识别与表述,显然,实验中涉及的问题直接与总目标相关,提出问题时必须认识到一个大的综合性实验不可能满意地回答所有的关键性问题。一个综合性实验要求实验者知道许多问题的答案,如果他们错了,结果将是令人失望的。这不仅浪费时间、材料和其他资源,也许还会导致根本不能满意地回答起初研究的问题。采用序贯的方法是一个较好

28、的策略。所谓序贯的方法,就是做一系列较小的实验,每个实验都有一个特定的目标,比如因子筛选。,2、响应变量的选择,2、 响应变量的选择 在选择响应变量时,实验者应该确信这个变量确实会对所研究的过程提供有用的信息。我们经常取测量特性的平均值或标准差(或两者)为响应变量。多重响应并非不常用。仪表性能(或测量误差)也是一个重要因子。如果仪表性能差,则只有相对大的因子效应才能通过实验检测出来,或者需要做附加的重复实验。在一些仪表性能不好的情形下,实验者可以多次测量每个实验单元,采用重复测量的平均值作为响应的观测值。在进行实验前,确定与响应的定义及测量方式有关的事项是非常重要的。,3、因子、水平和范围的选

29、择,3 、因子、水平和范围的选择 (如表1.1的注释所示,第2步和第3步通常同时进行,或者以相反的次序进行。)当所考虑的因子可能影响过程或系统的改进时,实验者发现这些因子通常可以分为潜在设计因子或讨厌因子,所以对它们进行进一步分类是有帮助的。一些有用的分类包括设计因子、保持常量因子和允许改变因子。,3、因子、水平和范围的选择,保持常量因子是指可能对响应施加一些影响的变量,但是对当前实验的目的而言,我们对这些因子并不感兴趣,所以它们将被保持在一个特定的水平。 允许改变因子,虽然实验单元或设计因子所运用到的“材料”通常不是类似地,但是我们经常忽略掉单元和单元之间的变异,而依靠随机化来抵消材料或实验

30、单元的效应。我们通常假定保持常量因子和允许改变因子的效应相对较小。 讨厌因子可能有较大的效应。尽管在当前的实验环境中我们对此并不感兴趣,但是必须考虑这种效应。讨厌因子通常分为可控因子、不可控因子和噪声因子。可控的讨厌因子是指它的水平可被实验者设置。例如,实验者在进行实验时可以选择原材料的不同批次或者一周中的不同日子。,3、因子、水平和范围的选择,前面讨论的区组概念经常用来处理可控的讨厌因子。如果一个讨厌因子在实验中是不可控的,但是它是可以测量的,那么采用一个被称为协方差分析的分析过程来补偿它的效应。例如,过程环境的相对湿度影响过程的性能,如果湿度不能控制,那么它有可能被测量且被视为协变量。若因

31、子在过程中自然变化且不可控制,但基于实验的目的而言它是可控的,则称此因子为噪声因子。在这种情况下,我们的目标通常是寻找可控实验因子的设置,以最小化噪声因子引起的变异性。有时称之为过程稳健性研究或稳健设计问题。 区组、协方差分析和过程稳健性研究在后续章节继续讨论。,3、因子、水平和范围的选择,一旦实验者选择了设计因子,他必须选择这些因子变化的范围及其特定水平,还必须考虑如何将这些因子控制在所希望的数值上以及如何测量这些数值。这种过程知识通常是实践经验和理论理解得结合。,能够研究所有的重要因子而不受过去经验的过分影响(特别是在实验的早期阶段或过程远未成熟时)是很重要的。,3、因子、水平和范围的选择

32、,当实验目的是因子筛选或过程刻画时,通常应选择较少的因子水平数。一般地,在因子筛选研究中两个水平是较好的。选择感兴趣的范围也是重要的。在因子筛选中,范围必须相对地大,即因子变化范围应该较宽。 当我们对哪些变量重要和哪些水平能产生最佳效果认识得更多的时候,感兴趣的范围通常就会变得窄一些。,实验前计划,从第1步到第3步所有的观点和过程信息是非常重要的。我们把这归诸于实验前计划。在许多情况下,一个人不可能拥有所需的全部知识来把这类事情做得充分好。因此,我们强烈呼吁在计划实验过程中的团队效应。,成功的关键大多取决于实验前计划的好坏。,4、实验设计的选择,4、实验设计的选择 如果正确的做了前面的实验前计

33、划活动,这一步就相对容易些。设计的选择涉及考虑样本量(重复次数),选择合适的实验次序,确定是否划分区组或者是否设计其他随机化限制。本书讨论一些较重要的实验设计类型。对于大多数问题来说,你都可以从中选择到合适的实验设计类型。 在实验设计的这个阶段,有许多交互式的统计软件包支持。(如minitab等)实验者可以输入包括因子数、水平和范围的信息,这些程序将会给出一个可供考虑的设计选择或推荐一个特定的设计。这些程序通常也会提供一个工作表(带已随机化的试验次序)用于指导实验的进行。,在选择设计时,时刻记着实验的目的是很重要的,在很多工程实验中,我们已经知道,有些因子水平会使响应得出不同的数值。因此,我们

34、想要识别是哪些因子引起差异并估计响应改变量的大小。在其他情况下,我们会更注意验证一致性。例如,比较两种生产条件A和B,A是标准的,B是成本效益更好的。实验者可能会想弄清楚这两种生产条件的产率是否没有差异。,5、进行实验,5、进行实验 进行实验时,需要仔细监控实验的过程以确保每件事情都按计划做完。在这个阶段,实验程序中的错误通常会破坏实验的有效性。而预先计划是成功的关键。在复杂的制造或研究开发环境中实施已设计好的实验,人们很容易低估物流方面和计划方面的问题 Coleman and Montgomery(1993)认为进行实验前,做少数试验或尝试性试验通常是有帮助的,这些试验提供了关于实验材料一致

35、性的信息,使你能够检查测量系统,对实验误差有一个粗略估计,以及有机会实践全部的实验技术。如果必要,可以借此机会重新审视在第14步中所作的决定。,6、数据的统计分析,6、数据的统计分析 分析数据应该用统计方法,以便结果和结论都是客观的,而不是主观臆断的。如果实验设计正确,并且按设计执行了,则所需的统计方法不必去费心准备。因为有限多优秀的软件包可用来分析数据,许多用在第4步中去选择设计的程序提供了无缝的、直接的界面进行统计分析。 在数据的分析和解释中,简单的图解法起着重要的作用。因为实验者想回答的许多问题可以纳入假设检验的框架,所以假设检验和置信区间估计程序非常有助于分析已设计好了的实验的数据。它

36、通常也有助于根据经验模型来给出许多实验的结果。经验模型是指从数据中推导出的等式,它表达了响应和重要设计因子之间的关系。残差分析和模型适合性检测也是重要的分析方法。,6、数据的统计分析,统计方法并不能证明一个因子(或几个因子)有特殊的效应。它们仅对实验结果的可靠性和有效性提供准则。只要统计方法应当得当。虽然我们不能用实验来证明任何事情,但是却可以用它们度量结论中可能出现的误差或者对一个命题附加上置信水平。统计方法的主要优点是它对决策过程加进了客观性。统计方法和良好的工程知识(或过程知识)以及常识相结合通常有助于人们得出正确的结论。,7、结论和建议,7、结论和建议 分析过数据之后,实验者必须作出有

37、关实验结果的真实结论,并推荐一种处理方法。这时候,图解法常常比较有用,特别是在给别人介绍成果时更是如此。另外,还需要进行跟踪试验与确认试验以证实实验结论的正确性。,通贯整个过程,要牢记实验是学习过程的一个重要部分,在学习过程中,我们暂时提出了关于系统的假设,进行实验来研究这些假设,根据实验的结果再提出新的假设,如此等等。这表明,实验是迭代式地逐步深化的。 通常一种错误的做法,是在研究一开始,就去设计一个单一、庞大和内容广泛的实验。一个成功的实验需要先弄清其中的重要因子,这些因子可能变化的整个范围,使用合适的水平个数,以及度量这些变量的合适单位。一般来说,我们不可能完全知道这些问题的答案。但是,

38、当我们不断实验下去就会获得对于它们更多的认识。随着实验的进展,我们经常会抛弃一些输入变量,而加入一些其他变量,改变某些因子的研究范围,或者加进新的响应变量。因此,我们通常序贯地进行实验。,小结:在实验中使用统计方法,在工程系、科学和工业中,大多数的研究工作都是以经验为根据的,并且广泛使用实验方法。统计方法能够大大提高这些实验的效率,并经常强化得出的结论。在实验中恰当地使用统计方法就要求实验者牢记下列几点。 1、利用你对问题非统计知识的了解 实验者通常精通于他们自己的专业。例如,专门研究水文学问题的工程师在这一领域内一般都有着丰富的实践经验和正规的科学训练。在某些领域,有一大堆的物理学理论用来论

39、述因子和响应之间的关系。这类非统计学方面的知识,在选择因子、确定因子水平、决定进行多少次重复、解释分析结果等方面是极有价值的。仅仅使用实验设计是无法替代这里应该考虑的问题的。,小结:在实验中使用统计方法,2、使设计和分析尽可能地简单 不要过分热心于使用复杂的、过于精致的统计方法。相对简单的设计和分析方法往往是最好的。此处我们重新强调1.4节中所推荐的步骤13.如果你实验前计划做的很仔细并且选择了正确的设计,那么分析方法相对来说往往是直截了当的。事实上,一个设计完美的实验有时几乎是自我分析!但是,如果你做出的实验前计划很马虎,并且执行的实验设计又很差,那么即使是用最复杂、最精巧的统计方法,也无可

40、救药。,小结:在实验中使用统计方法,3、识别实际的显著性和统计的显著性之间的差别 仅仅因为两种实验条件产生统计上不同的平均响应,还不能保证这一差别大得足以有实际价值。例如,以为工程师可以确定一种汽车燃料喷射系统的修正方法能够确实改进汽车汽油行驶的里程数,平均为0.1英里/加仑,这是一个在统计学上有意义的结果。但是,如果修正方法耗费1000美元,则0.1英里/加仑的差别可能就太小了,没有任何实际价值。,小结:在实验中使用统计方法,4、实验通常是迭代的 在大多数情况下,在研究的开始阶段,设计内容太广泛的实验是不明智的。成功的设计需要你了解重要的因子,这些因子变化的范围、每个因子合适的水平数,以及对每个因子和响应而言合适的组合方法和度量单位。一般来说,我们在实验之初并不能完满地回答这些问题,但是在实验进程中,我们可以不断深化对问题的认识。这表明了前面讨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论