企业机房检查标准_第1页
企业机房检查标准_第2页
企业机房检查标准_第3页
企业机房检查标准_第4页
企业机房检查标准_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

;|+l(R,O,vz?0 第一类、机房环境及物理检查ITPUB个人空间/n9hs_ITPUB个人空间66fhS(A)f ?k 一、机房内环境要求ITPUB个人空间#pJ |7q.t2uNa1ujb%i$E(0ITPUB个人空间B8KP1.温度与湿度:ITPUB个人空间+G CR7F x最佳工作温度:20-25摄氏度C(k l6V7gv6ID:Y-|!F f0ITPUB个人空间G m4I%zt W极限工作温度:10-40摄氏度0jBx-|s3xL0湿度: 8-80%(在23摄氏度条件下)r VP,q M5X I0U6Q0ITPUB个人空间i,d!xV3I5Z如果不是工作在最佳温度,请注意改善机房环境ITPUB个人空间*v1pH4ex;VITPUB个人空间#s-CVJk-fyp2.同时机房要保证清洁.ITPUB个人空间L2vVZI机房应保持清洁,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。ITPUB个人空间8H7+L w,N3_ITPUB个人空间xdAB Z 二、电源要求ITPUB个人空间6D+Cg4DfWITPUB个人空间$)Ya%s7L _$wpCH电 压:要求电压稳定, 尖峰电压会损坏设备ITPUB个人空间,9N9O0BW R6pJ;A-Wf4u 8G0电压范围:220V +/- 10%, 即200-240V, 50-60HzITPUB个人空间Tq:?C#c#q5TD0a9T-5RfigG3F0电源功率:视机器类型和系统配置而定364F x.O0Ad0ITPUB个人空间+J1G&hW7BYGdq电源线:标准的零, 地, 火三相电, 其中零, 地电压不得超过3.0V.ITPUB个人空间5M+JMfR)kPITPUB个人空间$+p 8z.EG电源接驳:用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,并建议配备发电机组;对于冗于电源的接入,建议采用两路单独输入.+n g Jf)|0ITPUB个人空间ZLJ.ho7oaab6x#%G kB0三、硬件检查Ofh&l1w0ITPUB个人空间$k4a7n7r6_O|,R检查服务器、磁阵的安装、电源线、7133和主机接线符合要求。C0I8p0$x# U0ITPUB个人空间s0rq7U$%X.g2C$e aMq_0服务器状态检查:ITPUB个人空间b8(P#N7u2EY1. 当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。W6j!wX 02. 当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的Service Guide查到相应告警原因,情况严重的,则要立即通知IBM技术专家进行问题排查。*aF+pi%b+Z-p%f01G2H K.p3j*G07133状态检查:E1E*Rgls7HZ0ITPUB个人空间b:&sq GmJ J磁阵前面板上有7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)。,h!a y%R!R0 N*W0Z-:zVV2N01. 当机柜的状态灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。Z$%c uh:_0bz6|C6bxQN02. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时或SSA环路出现问题时,则硬盘状态灯将熄灭,或者呈闪烁状态:以13秒的频率有规律地、不停地闪烁ITPUB个人空间%T b*cE8Ual-?gk! u0ITPUB个人空间L)|,|lRe;n!niA第二类、系统日常维护流程7XkJ?/ Jw/NQ02.1系统启动ITPUB个人空间;da0rfV;o!MJ3Po$fHU0*K0系统启动正常顺序如下:Ph y0dj#G-NO0ITPUB个人空间G;wvM首先对外设(磁盘阵列、磁带库等)加电。1F ywKg?N0;F WX;Yb0待所有外设加电自检完成后, 主机加电正常起机。主机加电后,系统进行自检,在液晶显示屏显示”ok”后,才能按白色POWER键起机.ITPUB个人空间9g%M7hHITPUB个人空间P LwQA Nh$Qf启动主机HACMP,启动后可用命令 tail -f /tmp/hacmp.out 来检查启动情况,在HACMP未完全启动前不要进行下一步。ITPUB个人空间Xc(UH6N8DC MZ,QF4?6o0检查服务器的网络地址,路由表(可用netstat -i , netstat -rn 等),检查文件系统,逻辑卷(可用 mount , lsvg -o 等)。ITPUB个人空间5FoF:nlqCW9M/gl3Wq0检查各项应用是否工作正常。*dW4?q*?1JFd0ITPUB个人空间s4gm1b5?3|Y&Y&tp4C S3a DG*o02.2系统关闭ITPUB个人空间9q N7T e;KqITPUB个人空间Q?*W%+Vx&LR;k-t3M W qi Y0停止HACMP( smitty clstop)。%fG?p5L0ITPUB个人空间$p7?9QW8y查看HACMP的状态,检查服务器的网络地址,路由表(可用netstat -i , netstat -rn 等),检查文件系统,逻辑卷(可用 mount , lsvg -o 等)。在HACMP未完全停止前不要进行下一步。UoIn0Wd%h;m0j,t2_!Z0C U -P%xLeY0关闭主机 (shutdown F)。重启系统可以使用:shutdown -FrU;?,q a o0s3e08W/li,U2|AC r,g0如有必要的话,按磁盘阵列前方的白色按钮关闭磁盘阵列。Z2U!7h53l0ITPUB个人空间1EuZ L96b,Hg?MP&cez7l 08lsT zUZ9QP0ITPUB个人空间HgKo.H2n8n-d2.3查看系统的错误记录7PiB7H0n&tp-D0ITPUB个人空间d0;KUnp0rp在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:ITPUB个人空间#bY-wI3OWITPUB个人空间z;j-dJ;h2N7s#errpt|more 查看系统所有的记录Y7s+Za2f0ITPUB个人空间)%Xp*f)IOf e(_ g.Nc7f&V0IDENTIFIERTIMESTAM PTCRESOURCE_NAMEDESCRIPTIONITPUB个人空间V f&?qw1P+e9Sj3b#BITPUB个人空间a6y$l9F,x$Bk PE85C5C4C P S CFGLFT SOFTWARE PROGRAM ERRORITPUB个人空间w*+y*Xe0O0l2sy(_E nHZ02BFA76F6 T S SYSPROC SYSTEM SHUTDOWN BY USERYA:qd5G s09SLK tZY3j09D4CF6E7 T O errdemon ERROR LOGGING TURNED ONITPUB个人空间N oXD,yjp*l;N XgY#T+Ns?j/4c)S01E2AC07E T O errdemon ERROR LOGGING TURNED OFFITPUB个人空间)icx$JlITPUB个人空间lk|+S u zLrWy/u$g1E5EER4T T O clstrmgr OPERATOR NOTIFICATION ITPUB个人空间6Ua#b$v$j7QT y i$x#D%D#P+k n O05B*FU;_4%|)i0ITPUB个人空间G%u m/n UZ7b J B!g其中d z+c3Q$K5r0ITPUB个人空间-qjyJ IIDENTIFIER 为错误编号,当需要检查详细信息时常会用到。9Ov;R-wvVS0ITPUB个人空间 wT? nJTIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年$I#D f0n9Y1c H0T 为Type , 它记录的是错误类型ITPUB个人空间8kV;$I!Mh*|hITPUB个人空间FdLr7e e!q%o1GNP :为永久错误,需引起注意ITPUB个人空间)nH/li:HM$N2ITPUB个人空间a4s:N6d1bN%AC&Z!QT :为临时错误。ITPUB个人空间ZNXp8u+c&_%WfVow Z$Mu0C 为Class,它记录的是错误种类,如8h+SHF0ITPUB个人空间 -?0Dv pQl1LH : Hardware%|* 2U:B C sV0!L#ak0B6t)?0S : Software/NFLs$ s0ITPUB个人空间7fz8Y U i4Q4q,J?iC fO : Errloger command messagesITPUB个人空间 ?!0daXL.mt&ITPUB个人空间g)Z?q&Q LW6bIU : undetermineddl$P9Jw /R/L0ITPUB个人空间B5PN4J3?V&L7N q,Q0vaM4M0RESOURCE_NAME为错误来源ITPUB个人空间 G)W-?SfITPUB个人空间 jZ V(|*jm&m?ODESCRIPTION 为错误描述o9h)fb,w*S09U/t ?$z7M)r-FK0ITPUB个人空间mW3!Y4y4U0H #errpt -aj 查看系统详细记录内容ITPUB个人空间6t $ p0)|6u ,Y90g g#Y0E4H0其中IDENTIFIER为错误编号,如 #errpt -aj BI2gM,Ja0eJ$a0_k)C?7ee0#errpt -dH 查看系统所有的硬件出错记录,D+QN9xrd+K0)uzS Ng0 T,niki.i%cp*05K N)R0I9r b8!02.4系统与数据备份Y6N HR0ITPUB个人空间|!M;PM4)ln G有效及时的系统备份是系统管理的非常重要的一环。当系统出现故障时,特别是文件系统被严重损坏或硬盘损坏时,常需要使用系统备份来恢复系统。在以下情况下应做系统备份:q:_zw0W&dt0+T u&w+xoGW*t6|0ITPUB个人空间 STt0pbz!T jwjY;JI2t01、新装机。在硬件及系统软件安装完成后,应做系统备份。ITPUB个人空间?u2D;_UZ$qk R Yf02、软件改动。系统软件或应用软件有改动时,应做系统备份。9MIP3w3 0ITPUB个人空间f+C5d8*)h3、定期备份。对系统进行定期备份,最好每两或三个月做一次备份a9O3nN9|0ITPUB个人空间 .w7X yRe备份注意事项:ITPUB个人空间9uEH i9ltM G #A&t0进行系统备份无须停止业务,业务可以继续进行。v5Rsu)aH00lT?+oVEH;b0建议客户进行定期的系统备份(使用命令smitty mksysb)。客户也可根据需要利用SMIT对系统的特定的VG或FS进行备份。.G4Oac9y(R,P-D$f0knZc7H(W0smitty mksysb只备份rootvg中mount起来的文件系统,其它文件系统或数据并没有做备份,所以数据备份需要另外完成(建议客户使用TAR格式)ITPUB个人空间K7M(b d:vITPUB个人空间;Mvr5RQ6o;w在条件允许的情况下,最好有一盘以上备份带,以防止磁带损坏。1nP h:L;T0,uC+E;GKB$Yt#?0系统备份过程中有时候会提示有些/tmp目录下的文件无法备份,显示如下::CL!A-gri8T:3Ub0ITPUB个人空间%D!m)?,Y6a6c uITPUB个人空间:;t8aU:zy#H KgDbV0Creating list of files to back up.ITPUB个人空间B8k)?bl2l rbme4hv0Backing up 34025 files.9e(Eo r)y |0ITPUB个人空间$UkG$M#t0TT&G tO1694 of 34025 files (4%).ITPUB个人空间(u/g#_g8d6)LyITPUB个人空间u%JK/gfVB2733 of 34025 files (8%).backup: 0511-449 An error occurred accessing ./JK;&dHC0ITPUB个人空间kk) w f)bBtmp/sh34736.1: A file or directory in the path name does not exist.ITPUB个人空间!k5wd?p+#SU6D:B-C H*r d0backup: 0511-449 An error occurred accessing ./tmp/sh34736.2: A file or directormP.w%d-j;S&t08x2A*p$b!0y in the path name does not exist.ITPUB个人空间*C6Di,YiN PITPUB个人空间?hw;x*m%i vbackup: 0511-449 An error occurred accessing ./tmp/sh34736.3: A file or directorITPUB个人空间:va pBD7_#X!v/A0 OR0y in the path name does not exist.ITPUB个人空间uI_7ZH0Q bZw2e5U4If/Z&f g0.ITPUB个人空间n :Ih m*KITPUB个人空间_ mYb(ZV all15458 of 34025 files (45%).ITPUB个人空间8Y9i2I+Lh!EqITPUB个人空间 r1dtI#u8e-qg&p31920 of 34025 files (93%).$dIA I8D*b$Gz&f0W7T/fG8d3T00512-003 mksysb may not have been able to archive some files.ITPUB个人空间f8ivC$ RVx+jITPUB个人空间BU/qi#N2hZdThe messages displayed on the Standard Error contained additionalITPUB个人空间#6z/d+i8s zwj$p6kw-eF-UB N6h2F0information.ITPUB个人空间;e4jS6tL9vQ)O0Hb5(bm;i+YTGu6!zV0ITPUB个人空间.A)O&vf%n(_这是正常现象,备份成功。ITPUB个人空间 C8o ?IEuITPUB个人空间b T2J|d,b(Z%W&E0d,R(S0ITPUB个人空间.E?8 J*cG2.5系统恢复 Z7F3Q AI08D J ?#C1U O/k0 ITPUB个人空间8I2Gpg3p,g2TiN!eITPUB个人空间du |2I2|qE5Z当系统发生比较严重的故障以致采取一般性维护手段不能在短期内恢复原系统,在与客户进行蹉商后,可将最近一次的系统备份带倒回机器内以全面恢复系统到最近一次做备份时的系统环境,然后可将当日的数据备份再倒回系统内。至此,系统可恢复正常运行。此后,客户应当与IBM工程师再进行整个事件的全面分析与回顾,以期找到故障发生的原因,并采取相应措施以杜绝类似事件再次发生。ITPUB个人空间lN9?%X|ITPUB个人空间5E0?L Er R Af4Z+KgMq1Y0R/c6f 8S$nY02.6 DUMPITPUB个人空间)C)E9T!dGV P) zITPUB个人空间U?h$E&F S5ygyuJ qQ0ITPUB个人空间6r5|(Z.c oznJH当系统运行出现软件故障导致系统down机时,机器的液晶显示器会出现 888 102 xxx 0c0 (xxx可能为700或其它),AIX常会将当时系统的运行情况记录下来,这就是DUMP。ITPUB个人空间Tn$HYv3 SITPUB个人空间i4M9|6m Ce$FITPUB个人空间z:AS&yTd#C tR/y rL当DUMP产生后,请将磁带放入磁带机,用命令 # snap -a -o /dev/rmt0将DUMP 文件拷贝到磁带设备/dev/rmt0 中。注明磁带机的block size, DUMP产生的日期和机器的型号及序列号。同时,请用# errpt -a /tmp/err.log 将errorlog 记在/tmp/err.log中,并将 /tmp/err.log 和 /tmp/hacmp.* 拷贝到软盘或磁带上。将磁带和软盘交给IBM工程师。t)c.Of1?Q*s9xJ09D+G%ia$JI!LLr0ITPUB个人空间,Qv2I%mOx|2.7日常检查服务器状态的项目及其相关命令b!Y3j;kp U V0ITPUB个人空间oj4M-Q%a 2ITPUB个人空间3Wb2Ta1s EU,W.w1 运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。#U;KUmJ6zW0,E(GQ q)di0Q$n/Ip6cG 0lsdev C H S a 列出系统中可用设备。U$kBXN3p T1Y6U0Xy d5zB,D!K0#lsdev Cc processor 列出系统中的所有CPU。ITPUB个人空间a)FO ZiX0|W#Hqsc:s;r0#lsdev Cc memory 列出系统中的所有内存。ITPUB个人空间 N&t1vF.hU1HITPUB个人空间 i0p%L3T8eGIRb#lsdev Cc disk 列出系统中的所有硬盘。ITPUB个人空间_wA jj%v%9bQ1g gITPUB个人空间$ S H#U/2_#lsdev -Cc adapter | grep ent 列出系统中的所有网卡9oc;Mpk0ITPUB个人空间)?!R6x0Hi#lsdev -Cc adapter | grep scsi 列出系统中的所有SCSI卡。ZRROl9Dp w0.y1Fx4Jo1s9WC0#lsdev -Cc adapter | grep ssa 列出系统中的所有SSA卡。ITPUB个人空间8$OWy1hWiI3HcGi1mj C#f5q0 L#hS0pjj+w.d0,qo |#kK02 lspv命令ITPUB个人空间v4X i .D0u!pvm tj-_4r%F0|IsBP v0#lspv 显示系统中可用的PV。8N,z0jol k*T iN |0!$v;?)U.m p0#lspv hdiskn 显示hdiskn的具体信息。+lOxNE08Zb B)KWv5S0#lsdev Cc pdisk显示磁盘阵列的硬盘的具体信息。ITPUB个人空间e2j4Q5I5Rl*FY a;0对SSA硬盘的检测:在对主机进行工作之前可以先把磁盘阵列上电,等主机完全启动后,登录到主机上,运行以下命令“ lsdev Cc pdisk “,应该可以看到所有SSA硬盘,并且状态应为Available.。f VwO %Zl.Ad&8p0ITPUB个人空间%Z2iP BM|7vITPUB个人空间$J7Tr;?e X*UjU03lsattr命令hs!QYO0ITPUB个人空间j-cz_(HG7G!vFE,H FW6,?uJ!6Z&U6A0# lsattr E l mem0列出系统中内存mem0的大小,本项目中内存有4GB。3Pf gTB0ITPUB个人空间c FRik$waQ:I.iM9H-Dw|&FP0C.ht&|S So04lsvg命令QB _)T$D#r3YgO2?0yN hz,h1R$y4Y0#lsvg 列出系统中所有的vg。#g3j /E.m k5xi0fH5$S;RqN0#lsvg rootvg 列出rootvg的详细信息。;kR S b6W0ITPUB个人空间1h5ou3q6a#lsvg o 列出激活的vgITPUB个人空间#_|?7rbyFxX;BZ,i7J0r!V*kh-BXPF0ITPUB个人空间Q0s/mo.P0i5oslevel命令Jm.ql#MPqG,0;_ Rs0fn)g5mg4Wgf I0#oslevel 显示操作系统版本信息。ITPUB个人空间1dDz,a&M0wrz7|C:a/XN3E i(cN,l,k0ITPUB个人空间Z6Rr9xf;g-G4h #pDpx06netstat命令f$BWs)M_+P0t:f,b!O-i0#netstat in 显示系统中各网卡的配置。可查看网卡的IP配置好了没有。ITPUB个人空间+s%r/4OgpE8?dn,p NAHeq0ITPUB个人空间U1O,p.|C-.lrOZMZITPUB个人空间 _9W6yT1k!H6f7# diag 命令ITPUB个人空间|BOv N/wWw-qCFNg_t0运行硬件诊断程序检测主机内所有硬件,检测结果为 “No trouble found ”显示各部分工作正常。ITPUB个人空间 W(j%Zb#N q,r.GbcY I0 x(h Z$ z0myO7w3%CE_08使用#diag命令1Uq&yV oRY5fu9B&a0rA6200(选择:Task Selection- SSA Service Aids)对SSA硬盘链路连接的校验,可以通过SSA 工具里的Link Verification 来检测。如有必要,可以用 Certify Disk运行硬盘诊断部分进行硬盘的表面分析测试 ,由1% 至100%,检测结果显示主机内置硬盘的所有扇区均读写正常。ITPUB个人空间-Q:TYteITPUB个人空间 xC$e0WtYLFJ9e0.LABY1f8J09lsps aITPUB个人空间!C H9X7XZ;PITPUB个人空间q6 h s/e查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。ITPUB个人空间)i(C)io34-zITPUB个人空间 WxB7c| p3QITPUB个人空间.B.D7S7Y?ITPUB个人空间6J?4ukB6e10lsvg o | lsvg il | grep i staleH2L X3JH0.hja3XqL0查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施ITPUB个人空间W q&bFc,y9Ki!O,Azz/N05Iwr RBVQd_0ITPUB个人空间U wm0pC*a0K.L2I11有否发给root用户的错误报告(mail)。ITPUB个人空间#dTPW lG$cJKweR9Mm0?8zK&U L012检查双机状态:lssrc g clusterK+S$RB6p/W0检查ha三个工作进程是否激活,/usr/sbin/cluster/clstat a检查双机状态是否up,并检查hacmp.out日志,看是否有异常信息。La6c F!b rxv:O0.WM7b!Pz G03T&f x8j/q0ITPUB个人空间;nU$q iWc F13用vmstat, topas,sar 命令;f/AjH Ho0检查系统性能,检查cpumemoyrIO ,是否存在性能瓶颈。ITPUB个人空间 jN:k,e4C4z.|n$G(bs p&YC7G0y;#sV|(Q2D0/;i2_ y o014检查能否顺利进入CDE界面,如果不能进入的话,要检查/etc/hosts表中有否错误的项目。I1T*UG2f Z%Y0ITPUB个人空间(s7G R8e8K&HWC?%-HdA%cpX*v0ITPUB个人空间J P#zj jN:T6H15用smitty ssaraid 查看磁盘阵列RAID盘的状态是否是Good。如果是degrade或其他状态表示RAID盘出现问题了_L:S+sj0R c%x g3J06| A:bzJd9cC S0FlM:QB0Oto w016用sysdumpdev l 查看系统的DUMP设置是否正常。ITPUB个人空间HM;q/n$7m-Ms&I*f6nU&_h0#P mL3p0h?lw1J017用instfix ik | grep ML当前操作系统补丁版本补丁程序(PTF)是否满足稳定运行的需要。一般要求433操作系统补丁要打到10以上,5.1操作系统补丁要打到5以上Y&sM:N0ITPUB个人空间:e,D6K6a!_v-Sy*sG,V0&q!m5&mW018使用df kP查看磁盘空间占用率,请确保以下文件系统的占用率高于80%立即上报:4LQB Y09?k5|#d2NU02.8性能监控与调优ITPUB个人空间SlqYm-*f;o0Q r06mq i?dn0通过命令vmstat 1 来观察.ITPUB个人空间L ut?&h1Z1!YoITPUB个人空间cYKX(,|Ogg ?rq0M9Dm6f$T!Wo0kthr memory page faults cpu)bZf4T90.TL(hy1_M m -Z0- - - - -ITPUB个人空间)C0D3?7pv4h)B7a*T0rb avm frerepipofr srcyin sycs us sy id waITPUB个人空间5m%fJA+Zj1Tenyd FEeL_0AY!CD%Zt0S0命令解析:vmstat 命令的输出可以反映系统整体运行状况,包括cpu、内存、虚拟页面、系统进程和系统调用情况。ITPUB个人空间3E _sITPUB个人空间1f(jM)rx 检查CPU是否为瓶颈,分别检查CPU的四项数值和kthr的两项数值.ITPUB个人空间+J|jnITPUB个人空间;_!YCUf检查MEM是否为瓶颈,分别检查Memory的两项数值和Page 的六项数值.ITPUB个人空间 t 7sQ6Q!ITPUB个人空间f_sM;?!mJR通过命令 sar mu P ALL 来观察。#p%_y k:iplS0ITPUB个人空间;UkYF命令解析:sar可以用来收集反映系统运行状况,在这里主要是查看CPU的运行状况,CPU是否负载均衡,是否存在分配不均的情况。ITPUB个人空间kB3OKhOITPUB个人空间QA8|,A,X G5G2T通过命令ps gv | more来观察。ITPUB个人空间 P9z%U:cVPID TTY STATTIME PGINSIZE RSS LIMTSIZ TRS %CPU %MEM COMMANDITPUB个人空间U+u5i2lJKJ?z7zf)ar xG0 0 - A 4:20 7 12 14516 xx 0 145040.05.0 swapper*Q9E0H9SV1O0ITPUB个人空间aerdC)H o0R 1 - A 1:33103 78952 79044 32768 25 360.0 29.0 /etc/inim0BY$nh ?+_0sAZ.T3u%i#c0命令解析:ps可以用来查看进程的当前状态。在这里通过参数的配搭,可以观察目前正在运行的进程所耗的时间,CPU和memory 量.其中,%CPU表示进程所占用的CPU资源情况,%MEM表示进程所占用的内存情况。主要检查是否有标示为的僵尸进程耗用系统资源,以及informix 数据库的oninit进程的系统消耗情况。ITPUB个人空间WzP;c4z9dv.ITPUB个人空间k R YD-C7O$x4CSRbn,my;d#Fb$I0在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用iostat 1 dhdiskX观察磁盘。ITPUB个人空间u0!(p,jN3J3g%M4q#RE7r9Erz0Disks: % tm_act Kbps tps Kb_read Kb_wrtnITPUB个人空间 bn U_1K1J6nQ命令解析: iostat可以用来查看系统的 I/O的输入输出情况,在这里主要查看阵列上的硬盘的每秒读写量,同时估算磁盘阵列读写速度HHhHhh ITPUB个人空间uLcOITPUB个人空间5)Quwt1H-c,ntIj。1R8lm ?8v2 k!h7I00RqTCD2|(NU.so00Xf k0q2V(H.a#0通过命令netstat a进行查看。ITPUB个人空间7G7Mj zITPUB个人空间 dfmD4awActive Internet connections (including servers);tU8OhnH,F9b0ITPUB个人空间S|p5foj g,aProtoRecv-QSend-QLocal Address Foreign Address (stateITPUB个人空间g8U#i_&ixITPUB个人空间 6i-K7DKZ2Y7jH92 ypB0命令解析: netstat可以用来查看系统的网络情况,在这里主要是查看网络客户端连接的情况和开销,检查参数为state,如有死连接,state状态为fin_wait, 这样耗用系统网络资源,从而导致网络性能下降构成瓶颈。6Nv FZd0;j:B|&s-e2zO00?5kDh0ITPUB个人空间A!Ye+xM*k&p/_8j6X2.9 安全工作守则ITPUB个人空间N7n9nW 7i8SA T*A5Xi7E2b7l+KY&K0,X*mO+w$F J2ED$x08c1yQ gnRMo0a.系统定期进行系统备份,系统盘建议镜像。ITPUB个人空间 BDjj6eAt_ k.m#I ?e6X4o 0b.当有系统变更或进行操作系统补丁安装的时候,必须作一次系统备份。7q5N)j!(fu as0ITPUB个人空间dD6O(?g:cC?%Muy(Ic.在7133和shark发现有硬盘故障的时候,请提醒客户注意当天的数据备份。在更换硬盘的时候,请确认当天数据备份已经完成。ITPUB个人空间+l4_ du!f5H7A%x(Y%in oKG0d.在更换敏感的电子元件,时候一定要防静电。ITPUB个人空间8PG/Tl vITPUB个人空间!r f#yF-D(H R Ve.在插拔外围设备的时候,请把外围设备下电。ITPUB个人空间4-e(UjF4JHtITPUB个人空间)so3P J.rDd;f0Gf.在进行主机微码升级时候,请留意微码的完整性。ITPUB个人空间4u_)g+gpJDCtIR0U0G9?8cK0g.在进行文件删除的时候,请留意当前路径是否正确。3R-UHx/u4Y,2H0nM;q/vf;r9l0h.在进行文件解压缩的时候,请留意参数和路径。ITPUB个人空间4E2j Eyx第三类、故障定位、故障排除 ByRi4A bnF#DXzoj:R(Sr 5q:s根据我们在实际商用系统中碰到问题,我们总结出了以下几种常见故障及其定位方式和解决方法。EUbuo,bp+v:y/Pv,dvKz3.1硬件故障F;nU u(yJITPUB个人空间5ZfBXlH$N,k(;Z硬件故障有很多种,对系统产生的影响也不一样,这里按其故障对系统的影响程度分:致命影响的硬件故障和只影响功能的硬件故障两类进行硬件分类:44I8Hh?uTfgvU9NS XSsoracle,db2,sqlserver,sybase,mysql,erp,scm,sap,java,.net其损坏对系统产生致命影响(将使机器宕机或无法启动)的硬件包括:t;ADg&Z%H v7AQ,dC主板、CPU、I/O柜(包含本地盘、光驱、PCI插槽等的柜子)或CEC柜(包含CPU/MEMORY等的柜子)、I/O柜与CEC柜的接线、电源模块、风扇、本地硬盘、内存损坏等等,JFV&Q|tITPUB个人空间u D;n%wwL#N注:I/O柜和CEC柜一般在比较高端的小型机才有,如M80,低端的是合一的。Fzi(U|.LVg%tO5L+x!S smc,C)xN2L+Toracle,db2,sqlserver,sybase,mysql,erp,scm,sap,java,.net这些设备的损坏等将使系统无法完成自检、引导和启动,液晶显示屏上都将有错误信息,可根据液晶显示屏上的错误码对照Service Guide查的错误原因,如果是工作状态下出现这些硬件损坏,则系统将被挂起或宕机。oracle,db2,sqlserver,sybase,mysql,erp,scm,sap,java,.net*Q/u.Vc0k#O,oTBNQ nITPUB个人空间en0T X;j0AiK!b#o;|Zsc5FwOHITPUB个人空间其损坏对仅对系统产生功能影响(机器不会宕机并能正常启动)的硬件包括:_$Ong|dnEhN/GS,Y网卡、本地硬盘有坏块、显卡、SSA卡和其他外围设备ITPUB个人空间 L(O,X9Thoracle,db2,sqlserver,sybase,mysql,erp,scm,sap,java,.net:eks,bRg这些设备的损坏只影响特定功能,如网络功能、显示功能、访问磁阵的功能等,对于本地硬盘有坏块的情况,则要看坏块中是否包含了重要的系统文件,如果不是重要系统文件,则系统功能不受影响,但也建议立即更换该硬盘。)QmF,MQew;O4O%DUgAe6ZK1aITPUB个人空间Npu8l)jN pnWITPUB个人空间k $zOc-RU)Yl2Y0j故障定位和排除:KVD d:WB.Of2qeXg Ih以上硬件故障信息都可以使用:!y4nEG0M D6UH*OJ|.Xu4k液晶屏上的错误码或:8Slh:OGD9ZITPUB个人空间Vd7A a0WITPUB个人空间errpt dH 查看到ITPUB个人空间JRB E?4zuswhs9bH7X9knMRw!? G)NI,a&sh根据错误码确定是什么硬件出了故障,对商用系统来讲,由于是双机系统,如果损坏机器是主机可以将此服务器切换成备机,然后修复故障机器,恢复系统。ITPUB个人空间zrhe.o1AL/T V3Yq#rr.P3.2磁阵故障|9qRtv1_Ioracle,db2,sqlserver,sybase,mysql,erp,scm,sap,java,.neti3bo$k g-qCnSE!*t?Q8QITPUB个人空间磁阵引起的故障是目前碰到的最频繁、危害最大的故障,据不完全统计,其故障覆盖到总故障的70%以上,具体来讲,可能引起磁阵故障的环节包括:| |;?VATB):&B2xtB|磁阵硬盘、7133柜子、主机上的SSA卡、连接

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论