工厂废水COD检测数据的数理统计分析.doc_第1页
工厂废水COD检测数据的数理统计分析.doc_第2页
工厂废水COD检测数据的数理统计分析.doc_第3页
工厂废水COD检测数据的数理统计分析.doc_第4页
工厂废水COD检测数据的数理统计分析.doc_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

沈阳航空航天大学 数理统计 工厂废水COD检测数据的数理统计分析 学 院能源与环境学院专 业热能工程学 号zhaoweiwei姓 名指导教师沈阳航空航天大学2012年12月1日目 录1 前言32 采集样本及数据整理52.1 数据的搜集方法及说明52.2 数据整理:给出频数、频率分布表及说明62.3 画出直方图和折线图并给出说明72.4 画出经验分布函数93 假定总体服从正态分布,给出,的估计113.1 矩估计法113.2 极大似然估计123.3 若总体不是正态分布请探求其参数估计134 参数区间估计154.1 方差未知,求数学期望的置信区间154.2 数学期望,均未知,求方差的置信区间154.3 若总体服从weibull分布对其参数进行区间估计165 参数的假设检验185.1 样本统计数据的t检验185.2 样本统计数据的检验186 非参数假设检验206.1 拟合优度检验206.2 KS检验226.3 当上述检验被接受或被拒绝时,请结合实际问题给出说明257 结论268 参考文献271 前言近年来,在我国工业的高速发展的同时,环境污染也在不断加剧,我们赖以生存家园在不断遭到破坏。因此政府清晰地认识到加强环境保护刻不容缓,必须对工业生产过程中产生的各种污染要进行严格监控。那么要想做好这项工作,我们不仅需要有效地检测技术还必须具备有效地数据分析方法。在检测数据出来以后 如何依据众多的检测数据深入了解数据的变化规律,如何利用众多检测数据对环境质量作出正确的评价,这对环境质量评价及三废治理来说,有十分重要的意义。而要想依据部分数据而深入了解事物的全体,我们不难想到要借用数理统计进行研究。数理统计是应用广泛的一个数学分支它是以概率论为基础的科学,它可根据试验或观察到的数据,运用科学、的方法对研究对象的客观规律作出种种合理的估计和判断。也就是说通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断,根据资料为随机现象选择数学模型,且利用数学资料来验证数学模型是否合适,在合适的基础上再研究它的特点,性质和规律性。事实上,近几年数理统计的一些原理、方法被用于水质监测屡见不鲜,一些大中城市的水厂化验室都相继将数理统计的方法直接应用于水质检验,这就是水质分析的质量控制。在本设计中主要是针对沈阳市蒲河上游某大型化工厂排放废水中有机物含量的检测和统计学分析。近几年蒲河的水体污染严重,造成地表水污染,水质异常,颜色发暗,气味恶臭,且伴有油污,鱼类和其他水生物几乎绝迹,沿河水生态环境遭到严重破坏,通过相检测结果我们知道,浦河河水中污染物很大一部分是化学耗氧量,水体富营养化。为此沈阳市政府采取了一系列的检测和治理措施。所谓监测就是严格监控浦河上游重大工厂排水有机物污染含量。本设计就是针对其中某家大型化工厂排放废水进行的监测分析,利用数理统计相关知识,对工厂排水有机物污染含量服从的分布境况及对工厂关于向上级政府报告或对媒体公开的一些数据进行科学的判定,比如说, 该化工厂在相关报告中一再表明企业内部定期会对水质进行检验,而且大量的COD监测结果表明污染物耗氧相对较低。平均值不会超过,其工厂排水有机物污染含量没有超过国家环保局规定的标准;工厂生产比较稳定,废水污染物含量波动不会太大等等一系列的问题。2 采集样本及数据整理2.1 数据的搜集方法及说明合理的收集数据是进行水质监测统计分析步骤中不可或缺的,而对于化工厂来说,排污量取决于工艺流程及治理情况。目前许多单位采用少量的瞬时取样,难免有片面。根据数理统计相关知识我们知道必须有足够数量的观测数据,否则只能是蜻蜒点水浮光掠影,不可能阐明事物间内在联系与客观规律,特别是水质监测数据的大小受其他因素的影响颇大,如水中污染物的浓度除受污水排放的数量、污染物性质影响外,还与监测时、水位、水速度、取样点的位置,频度等因素有关。因此,单凭少数监测资料就下结论,则随机误差极大,可靠程度极差。为了克服这些问题,我们沈阳航空航天大学清洁能源研究所相关成员对该化工厂的排水口,在8天192小时内每隔2小时进行采样,并测定其COD值,测定结果如表2.1所示。(注:测定COD的方法的方法是取适量水样以高锰酸钾为氧化剂,于沸水浴加热30 分钟后,加入草酸钠使之褪色,趁热用高锰酸钾滴定,终点为微红色。滴定所消耗的高锰酸钾量折成氧的量,以毫克/升表示)表2.1日期测定结果折算成的耗氧量()第一天22.115.611.921.725.222.117.317.225.61510.72.8第二天7.328.510.88.63.82.811.912.322.914.930.220.4第三天12.38.619.114.410.613.422.216.519.421.711.228.3第四天19.121.122.222.114.911.110.15.217.711.910.924.3第五天26.818.99.518.23021.314.114.323.818.913.65.1第六天9.524.815.311.67.45.616.21722.818.527.821.9第七天17.111.724.21812.617.322.619.816.111.88.330.2第八天15.918.221.720.718.715.412.39.420.116.415.3232.2 数据整理:给出频数、频率分布表及说明1)将数据排序,找出最小值,最大值,极差为2)将数据分组,根据样本容量n的大小,决定分组数k。按经验公式: 结合一般规律下,当60n100,有8k10,所以取。 组距=极差组数:3) 确定组限和组中点值组距=组的上限一组下限,为了方便计算频数及所有数据均能划分到相应的组内组的上限与下限应比数据多一位小数。, 取,(a略小于m,b略大于M,且a和b都比数据多一位小数),具体分组如下表2.2:表2.2组序区间范围组中值频数fj频率Wj=fj/n累计频率Fj1(2.75,6.254.560.0625 0.06252(6.25,9.75880.0833 0.14583(9.75,13.2511.5170.1771 0.32294(13.25,16.7515170.1771 0.55(16.75,20.2518.5180.1875 0.68756(20.25,23.7522170.1771 0.86467(23.75,27.2525.570.0729 0.93758(27.25,30.752960.0625 1由上表我们可以看出多数测定值集中在测定平均值附近,有些测定值比平均值大,有些测定值比平均值小,而这两者的数目大致上差不多,另外我们还能看出比平均耗氧量大很多或很小的数目很少。2.3 画出直方图和折线图并给出说明直方图是频数分布的图形表示,它的横坐标表示所样本值的取值范围,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。在这里我采用纵坐标为频率/组距的表示方法绘制直方图。既有纵坐标:做出频率直方图和折线图及累积频率折线图如下:从频率直方图我们能大致猜测工厂所排废水单位质量耗氧量所服从的分布,由直方图可见多数测定值集中在测定平均值附近,有些测定值比平均值大,有些测定值比平均值小,而这两者的数目大致上差不多,比平均值大得很多或很小的数值其数目是很少的,且整个图形大致呈现对称趋势,所以我们不难发现废水单位质量耗氧量的这样一个分布形状正是一个形似正态分布的图形;另外通过累计频率折线图,我们发现样本频率累计折线和正态分布及函数曲线非常相近,根据所有的这些信息。我们大致可以猜测废水单位质量耗氧量服从正态分布或者weibull分布并且其数学期望大致在18附近。2.4 画出经验分布函数设 X1, X2, , Xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 X(1), X(2), , X(n),则称 X(1), X(2), , X(n) 为有序样本,用有序样本定义如下函数 , 根据样本数据画出经验分布函数如下:3 假定总体服从正态分布,给出,的估计3.1 矩估计法替换原理是指用样本矩去替换相应的总体矩,譬如:用样本均值估计总体均值E(X),用样本方差估计总体方差Var(X),用样本的k 阶矩替代总体的 k 阶矩。其中k阶原点距:在这里正态分布与均是未知参数,即未知参数个数k=2,因此我们采用样本均值和二阶原点矩对样本进行估计。对于正态分布有:期望 E(X)=样本二阶矩 可得以下方程组: 即 所以有与的矩估计量分别为: 由此即可得到与的矩估计值: , 3.2 极大似然估计正态总体是二维参数,设有样本 X1, X2 , , Xn,则似然函为: 对数似然函数为:将 分别关于两个分量,求偏导,并令其为0, 即得到似然方程组: 解此方程组,可得 的极大似然估计量为: 将之代入第二方程,得出的极大似然估计量为:将样本值代入,得出 ,的极大似然估计值为 , 3.3 若总体不是正态分布请探求其参数估计从折线图可以看出总体也可能服从两参数的weibull分布,那么下面针对总体分布探讨其参数估计。对于分布,其分布函数为: 密度函数为:1)矩估计:在这里weibull分布与均是未知参数,即未知参数个数k=2,因此如果我们采用样本均值和二阶原点矩对样本进行估计。对于weibull分布有: 但是本方程组分析解一般很难求出,在这里我就不对其进行求解,而通过查阅文献【5】获得与的另一种矩估计形式如下。设总体设总体为来自总体的n个独立的样本,由矩估计通过简化求解可得和的估计:其中:一般取0.0050.1,在这里我们取a=0.05,代入样本值得:2)极大似然估计: 总体是二维参数,设有样本 ,则似然函为: 对数似然函数为:将 分别关于两个分量,求偏导,并令其为0, 即得到似然方程组:由于解这个方程组可得到和的估计值和,但这是两个超越方程,不易求出解析形式解。将样本值代入以上方程组通过matlab对其进行数值求解,最终解得:4 参数区间估计4.1 方差未知,求数学期望的置信区间设总体服从正态分布,方差未知,求数学期望的置信区间,给定的置信水平为,即可按一下步骤求得:选择样本函数作为输轴量: 由 即可构造可得的置信区间为:其中,样本数据:代入上式可得的置信区间为: 。4.2 数学期望,均未知,求方差的置信区间同理选择样本函数作为输轴量: 由于分布是偏态分布,寻找平均长度最短区间很难实现,一般都用等尾置信区间:采用的两个分位数 两个上分位数,在其两侧各截面积为的部分,使得 其中为的上分位点。由以上可得置信水平为的置信区间为:其中 ,样本数据:代入上式可得的置信区间为: 。4.3 若总体服从weibull分布对其参数进行区间估计在假设总体服从两参数的weibull分布的前提下,对总体分进行区间估计。通过查阅文献【6】得知以下定理:设总体,为来自总体的样本 ,的置信水平的置信区间为: 取,则前32个顺序统计量观测值如下表:表4.112.898.31710.72511.922.8108.61810.82611.933.8118.61910.92711.945.1129.42011.12812.355.2139.52111.22912.365.6149.52211.63012.377.31510.12311.73112.687.41610.62411.83213.4取置信水平为:,代入数据通过matlab求解以上方程组1式得:的置信区间为: ,将m极大似然估计值代入2式得的置信区间为。5 参数的假设检验5.1 样本统计数据的t检验该工厂在相关报告中一再表明其工厂排水污染物耗氧相对较低。平均值不会超过15.那么该工厂提供数据是否显著有效。我们就本次试验数据对其进行检验。即在假设工厂排出的污水耗氧量服从正态分布且未知条件下的前提下对总体期望进行检验。1)提出原假设和备择假设 2)取一检验统计量,在成立下有3)对给定的显著性水平=0.05,查表确定临界值,使即“”是一个小概率事件 ,因此得拒绝域 W: 。4)将样本值代入算出统计量 t 的实测值,得到,因此落入拒绝域,即可以认为厂家声明的水体污染物平均耗氧量小于15不可靠,水体耗氧量应该大于15.我们可以认为其工厂排出的污水有机物污染程度比其相关报告公布的要严重。5.2 样本统计数据的检验 化工厂一再表明其工厂排污水位体积耗氧量整体比较稳定其标准差,所以无需进行太多次的水质检测。那么事实是否真的如工厂所说的那样我们得就本次试验数据对其进行检验。即认为工厂所排污水单位体积耗氧量,在未知的情况下对进行检验。1)提出原假设和备择假设 2)取一检验统计量,在成立下有3)对给定的显著性水平=0.05,查表确定临界值,使即“”是一个小概率事件 ,因此得拒绝域 W: 。4)将样本值代入算出统计量 t 的实测值,得到:因此落入拒绝域,可以认为厂家所言的工厂所排污水单位体积耗氧整体比较稳定和标准差是不可靠的。事实证明工厂所排污水单位体积耗氧标准差超过5毫克。6 非参数假设检验6.1 拟合优度检验对样本总体是否服从正态分布进行拟合优度检验设检验假设的统计量为:则当n充分大为真时统计量近似服从分布,即当为真统计量不应该太大,所以如果,拒绝域的形式为:,所以给定显著水平,确定,使得:所以有。即在显著水平条件下,若统计量的样本观测值则拒绝原假设,否则接受原假设。下面进行具体计检验:1)进行假设检验假设:由于均是未知参数,因此我们需要通过最大似然估计法对其进行估计,根据前面的计算结果可知它们的估计值,。2)计算检验统计量样本观测值我们将X的可能取值区间划分为7个小区间并取为事件,如表中所述。那么在为真的前提下计算各区间概率估计值,例如:同理计算各区间概率填入下表6.1:表6.1 60.05335.11687.035680.08878.51527.516170.156415.014419.2482170.20719.87214.5431180.205519.72816.4234170.153114.697619.6631由上表可计算统计量观测值: 3)计算拒绝域:合并组后,故此的自由度为,给定显著水平,既有则拒绝域为由于,因此接受原设,可以认为该工厂排出污水单位体积耗氧量服从正态分布。6.2 KS检验对样本总体是否服从weibull分布进行KS检验 1)进行假设检验假设:由于均是未知参数,因此我们需要通过最大似然估计法对其进行估计,根据前面的计算结果可知它们的估计值,。2)选择统计量: ,拒绝域: 给定显著水平;3)计算检验统计量样本观测值 a.把样本观测值从小到大排列见下表第一列 b.计算经验分布函数同样列入下表第三列当原假设为真时,计算weibull分布函数的值列如下表第四列 计算,分别填入下表第五列第六列表6.2 12.8000 0.0208 0.0046 0.0046 0.0163 23.8000 0.0313 0.0108 0.0100 0.0204 35.1000 0.0417 0.0247 0.0065 0.0169 45.2000 0.0521 0.0261 0.0155 0.0260 55.6000 0.0625 0.0321 0.0199 0.0304 67.3000 0.0729 0.0670 0.0045 0.0059 77.4000 0.0833 0.0695 0.0034 0.0138 88.3000 0.0938 0.0950 0.0117 0.0012 98.6000 0.1146 0.1045 0.0108 0.0101 109.4000 0.1250 0.1325 0.0179 0.0075 119.5000 0.1458 0.1362 0.0112 0.0096 1210.1000 0.1563 0.1599 0.0141 0.0037 1310.6000 0.1667 0.1811 0.0249 0.0145 1410.7000 0.1771 0.1856 0.0189 0.0085 1510.8000 0.1875 0.1900 0.0129 0.0025 1610.9000 0.1979 0.1945 0.0070 0.0034 1711.1000 0.2083 0.2037 0.0058 0.0046 1811.2000 0.2188 0.2084 0.0000 0.0104 1911.6000 0.2292 0.2275 0.0088 0.0017 2011.7000 0.2396 0.2324 0.0032 0.0072 2111.8000 0.2500 0.2374 0.0022 0.0126 2211.9000 0.2813 0.2424 0.0076 0.0389 2312.3000 0.3125 0.2628 0.0185 0.0497 2412.6000 0.3229 0.2785 0.0340 0.0444 2513.4000 0.3333 0.3221 0.0008 0.0112 2613.6000 0.3438 0.3333 0.0000 0.0104 2714.1000 0.3542 0.3619 0.0181 0.0077 2814.3000 0.3646 0.3735 0.0193 0.0089 2914.4000 0.3750 0.3793 0.0147 0.0043 3014.9000 0.3958 0.4087 0.0337 0.0129 3115.0000 0.4063 0.4146 0.0188 0.0084 3215.3000 0.4271 0.4325 0.0262 0.0054 3315.4000 0.4375 0.4384 0.0113 0.0009 3415.6000 0.4479 0.4504 0.0129 0.0025 3515.9000 0.4583 0.4684 0.0204 0.0100 3616.1000 0.4688 0.4804 0.0220 0.0116 3716.2000 0.4792 0.4864 0.0176 0.0072 3816.4000 0.4896 0.4983 0.0192 0.0088 3916.5000 0.5000 0.5043 0.0147 0.0043 4017.0000 0.5104 0.5342 0.0342 0.0237 4117.1000 0.5208 0.5401 0.0297 0.0193 4217.2000 0.5313 0.5460 0.0252 0.0148 4317.3000 0.5521 0.5519 0.0207 0.0002 4417.7000 0.5625 0.5754 0.0233 0.0129 4518.0000 0.5729 0.5928 0.0303 0.0199 4618.2000 0.5938 0.6043 0.0314 0.0106 4718.5000 0.6042 0.6214 0.0276 0.0172 4818.7000 0.6146 0.6326 0.0284 0.0180 4918.9000 0.6354 0.6437 0.0291 0.0083 5019.1000 0.6563 0.6547 0.0193 0.0016 5119.4000 0.6667 0.6709 0.0146 0.0042 5219.8000 0.6771 0.6920 0.0253 0.0149 5320.1000 0.6875 0.7074 0.0303 0.0199 5420.4000 0.6979 0.7225 0.0350 0.0245 5520.7000 0.7083 0.7371 0.0392 0.0288 5621.1000 0.7188 0.7560 0.0477 0.0373 5721.3000 0.7292 0.7652 0.0464 0.0360 5821.7000 0.7604 0.7829 0.0538 0.0225 5921.9000 0.7708 0.7915 0.0311 0.0207 6022.1000 0.8021 0.7999 0.0290 0.0022 6122.2000 0.8229 0.8040 0.0019 0.0189 6222.6000 0.8333 0.8199 0.0030 0.0134 6322.8000 0.8438 0.8276 0.0058 0.0162 6422.9000 0.8542 0.8313 0.0124 0.0229 6523.0000 0.8646 0.8350 0.0192 0.0296 6623.8000 0.8750 0.8627 0.0019 0.0123 6724.2000 0.8854 0.8753 0.0003 0.0101 6824.3000 0.8958 0.8783 0.0071 0.0175 6924.8000 0.9063 0.8926 0.0032 0.0136 7025.2000 0.9167 0.9032 0.0030 0.0135 7125.6000 0.9271 0.9130 0.0037 0.0141 7226.8000 0.9375 0.9380 0.0109 0.0005 7327.8000 0.9479 0.9543 0.0168 0.0064 7428.3000 0.9583 0.9611 0.0132 0.0027 7528.5000 0.9688 0.9635 0.0052 0.0052 7630.0000 0.9792 0.9783 0.0096 0.0009 7730.2000 1.0000 0.9798 0.0007 0.0202 由表可知:即有不落在拒绝域中因此不拒绝原假设,可认为样本来自总体。6.3 当上述检验被接受或被拒绝时,请结合实际问题给出说明通过对总体是否服从正态分布进行X2拟合优度检验,结果显示在显著水平为0.05的前提下可以认为COD监测数据废水单位质量耗氧量服从正态分布,即。通过对总体是否服从weibull分布进行k-s检验,结果显示在显著水平为0.05的前提下同样可以认为COD监测数据废水单位质量耗氧量服从weibull分布,即总体。如果想进一步判定样本的最优分布,我们可以通过残差分析法进行判断,哪个残差更小则样本更倾向于服从该分布。因为时间原因,本设计就不做进一步判定。7 结论通过本设计我们运用数理统计对某家大型化工厂排放废水COD监测数据进行对工厂排水有机物污染含量服从的分布境况及对工厂关于向上级政府报告或对媒体公开的一些数据进行科学的判定。其中通过对总体是否服从正态分布我们采用了X2拟合优度检验,结果显示在显著水平为0.05的前提下可以认为COD监测数据废水单位质量耗氧量服从正态分布,即。通过对总体是否服从weibull分布我们采用了k-s检验,结果显示在显著水平为0.05的前提下同样可以认为COD监测数据废水单位质量耗氧量服从weibull分布,即总体 。另外通过假设检验,我们发现在显著水平为0.05的情况下认为厂家声明的水体污染物平均耗氧量小于15不可靠,水体耗氧量应该大于15,也就是说其工厂排出的废水有机物污染程度比其相关报告公布的要严重。 其次厂家所言的工厂所排污水单位体积耗氧整体比较稳定和标准差,在显著水平为0.05的情况下也是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论