医学科研方法08sas简介_第1页
医学科研方法08sas简介_第2页
医学科研方法08sas简介_第3页
医学科研方法08sas简介_第4页
医学科研方法08sas简介_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/4/15SAS简介暨南大学医学院流行病学教研室2023/4/15概述SAS为statisticalanalysissystem的缩写,即统计分析系统由美国北卡罗纳州州立大学的A.J.Barr和J.H.Goodnight两位教授于1966年开始研制、1976年正式推出。SAS具有强大的统计分析功能。2023/4/15Windows操作系统SAS6.12版本的一些实用操作方法2023/4/15安装SAS1、设定时间这是SAS供货商在提供Setinit.sas文件时允许你使用的时间,例如设定2003年7月16日为开始使用时间。2023/4/152、把SAS软件的光盘装入光驱,自动运行后,点击,启动安装。2023/4/153、点击,安装下一步。2023/4/154、点击,安装下一步。2023/4/155、默认安装方式为“Typical”,这里选择“Custom”(其它可任选);默认安装位置“C:\SAS”(可改变其它安装位置),点击,安装下一步。2023/4/156、选择全部安装项目(可以只选择部分项目),点击,安装下一步。2023/4/157、点击,安装下一步。2023/4/158、点击,安装下一步。2023/4/159、点击,安装下一步。2023/4/1510、点击,安装下一步。2023/4/1511、安装运行过程中。2023/4/1512、点击,安装下一步。2023/4/1513、点击,安装下一步。2023/4/1514、点击,安装下一步。15、点击,安装下一步。2023/4/1516、选择“Setinit.sas”文件存放的路径和文件名,在窗口中输入,这里为“j:\sas密码”。点击,安装下一步。2023/4/1517、其余文件如果不需要安装,除去选项前的圆点即可,点击,安装下一步。2023/4/1518、点击,安装下一步。2023/4/1519、点击,完成安装,退出SAS安装系统。2023/4/1520、在目录“我的电脑\C:\SAS”下右键点击并按住“”图标不放,拖拉到桌面,按照提示,建立运行SAS的快捷方式。2023/4/15SAS的功能1.数据交换可以用任何格式读入数据值,然后将数据转换成SAS数据集。它具有很强的与外部文件交换信息的功能,可以用文件操作管理方法把不同数据库的数据组合在一起,供SAS过程分析处理,也可以将SAS数据集的数据转换成其他格式的数据文件,供其他软件处理。2023/4/152.数据管理SAS为用户提供完备的SAS语句和函数用于数据加工处理,有些语句用于执行标准操作,如:建立新变量、数据查询、累加求和及修改错误等;2023/4/15DO/END、IF-THEN/ELSE等控制语句,用于选择满足条件的数据构成新的数据子集;DROP、KEEP等信息语句,用于选择在新数据子集中被删除和保留的原数据集中的变量;SET、MERGE等文件操作语句,可以进行数据集的合并、拼接,从而构成了一套完整的语言系统。不仅可以同时处理多个数据文件,而且可以将一个数据集拆分成几个数据子集分别处理。2023/4/153.数据分析①计算简单的描述统计量,如均数、标准差、标准误、总和、平方和、极差、相关系数、峰度系数、偏度系数等,多达40项;②计算概率分布函数、分位数和产生随机数;③对数据进行标准化、编秩及计算其统计量;2023/4/15④产生并分析列联表;⑤进行方差分析、相关与回归分析、线性模型拟合、属性数据分析、多变量数据的判别和聚类分析、非参数统计分析、生存分析、时间序列分析、实用预测、质量控制、运筹学统计分析等过程;2023/4/15⑥绘制二维与三维的基本统计图,如条图、直方图(水平或垂直)、圆图、散点图、等差和等比线图、曲线拟合图、时间序列图等,从数据中获得有价值的信息,便于指导实践研究。2023/4/154.数据呈现可以将数据和统计分析结果打印输出,可以将某个过程产生的数据输出到另外的数据集中,用另一个过程进行处理。2023/4/15可以将多个过程产生的数据组合成新的数据集(有时需使用宏语言),归纳总结后一起输出或再分析。可以通过列表报告和汇总报告输出分析结果,可以根据用户自定义的报表输出。2023/4/15SAS的功能模块1.BASESASSAS系统的核心承担主要的数据管理任务管理用户使用环境进行用户语言的处理调用其他SAS模块和产品。2023/4/15BASESAS在SAS运行时启动,是SAS系统的中央调度室,具有数据管理、程序设计及描述统计功能。单独存在或与其它模块共同构成系统。模块安装与更新通过BASESAS安装程序进行。2023/4/152.SAS/STAT统计分析模块该模块包括——回归分析、方差分析、定性数据分析、多变量分析、判别和聚类分析、残存分析、心理测验分析和非参数统计分析等40多个过程。SAS/STAT还为——主成分分析、典型相关分析、判别分析和因子分析提供了许多专用过程。是国际上统计分析领域中的标准软件。2023/4/153.SAS/INSIGHT交互数据分析模块。进行交互式数据探索和分析的工具,运用鼠标和系统提供的下拉菜单,可以同时打开多个窗口对数据和图像进行比较、探索和分析。对表中的数据进行检测时,可以同时将这些数据显示在直方图、散点图和三维旋转图上,便于用户发现奇异值。利用INSIGHT分析单变量分布和多变量分布,用方差分析、回归分析和广义线性模型拟合要说明的模型。2023/4/154.SAS/ASSIST菜单驱动模块集成了SAS系统其他模块的各种功能,提供了一个菜单驱动、任务导向的用户界面。用户不需编程,只要根据数据的需要,用鼠标直接点击SAS功能,免除学习SAS语言之苦,根据需要调用SAS/ASSIST的不同部分或裁剪其菜单构成自己的应用系统。2023/4/155.SAS/GRAPH绘图模块能完成多种绘图功能,如直方图、圆图、星形图、散点图、线图、曲线图、三维曲面图、等高线图和地理图等,这些图形可以非常形象、直观地表现各变量之间的关系及数据的分布状态,对解决各种实际问题起着重要的辅助作用。2023/4/156.SAS/ACCESS数据库接口模块提供与流行数据库软件的接口,可建立外部其他数据库的一个统一的公共数据界面。接口是双向的,既可将数据读入SAS,也可在SAS中更新外部数据或将SAS数据加载到外部数据库中。2023/4/157.SAS/ETS

经济计量学和时间序列分析模块是研究复杂系统和进行预测的有力工具。包含全面的时间序列时域分析和谱域分析,如实用预测(逐步自回归、指数平滑、Winters方法)、序列相关校正回归、分布滞后回归、ARIMA模型、状态空间方法、谱分析和互谱分析等2023/4/158.SAS/OR运筹学模块优秀的决策支持工具,提供全面的运筹学方法。包含通用的线性规划、整数规划以及混合整数规划和非线性规划方法,包含项目管理、时间安排和资源分配等。2023/4/159.SAS/IML矩阵程序设计语言模块提供了完整的面向矩阵的交互式矩阵编程语言(interactivematrixlanguageIML)该语言处理的基本数据元素是数据矩阵,数值型、字符型数据可以处理。实现各种复杂的矩阵运算,在控制语句的帮助下实现其他算法。2023/4/1510.SAS/FSP快速数据处理的交互式菜单系统模块。具有全屏幕数据录入、编辑和查询以及数据文件创建等功能。可以对一条记录进行操作,也可以在一个屏幕上操作多个记录。同时,它也是一个开发工具。2023/4/1511.SAS/AF交互式全屏幕软件应用系统模块是一个应用开发工具。可将包含众多功能的SAS软件作为方法库,利用SAS/AF的屏幕设计能力以及SQL语言的处理能力来快速开发各种功能强大的应用系统。2023/4/15SAS显示管理系统点击“”图标或快捷方式图标(或其它方式)启动SAS,即进入SAS的显示管理系统(DMS)界面,它主要由三个窗口——PROGRAM、EDIT窗口、LOG窗口和OUTPUT窗口)和窗口上方的运行菜单、工具条图标组成。2023/4/15SAS的三个窗口2023/4/151.PROGRAMEDIT窗口又称程序编辑窗口或文本编辑器主要功能是编辑SAS程序语句,并将程序语句提交系统执行。程序语句都是纯文本格式,在编辑程序语句时,每行语句前面可以显示语句标号(如00001~00016,称为数字区)。2023/4/152.LOG窗口(日志记录窗口)主要作用是显示运行程序后的有关信息。显示的信息内容包括——建立了哪个数据集;建立的数据集包括多少变量和观测;执行了什么过程;执行过程运行了多少时间;语句中有什么错误等等。2023/4/15如果语句过程没有错误,提示信息用蓝色字体NOTE表示;如果语句中有SAS系统能够纠正的错误,则提示信息为绿色字体WARNING表示;如果语句中有SAS系统无法纠正的错误,则提示信息用红色字体ERROR用表示。2023/4/153.OUTPUT窗口(结果输出窗口)在启动SAS后不直接显示,被PROGRAMEDITOR窗口和LOG窗口覆盖,在运行了某个过程后才显示。该窗口的主要作用是显示程序运行的结果。在运行SAS系统期间,相继产生的输出结果都附加在上—次结果的后面。2023/4/15其他辅助窗口,如——HELP、KEYS、LIBNAME等,这些窗口可根据需要打开或关闭。2023/4/15SAS程序SAS程序是在PROGRAMEDITOR窗口中编辑的一段SAS语句,提交后在LOG窗口显示有关信息和提示,在OUTPUT窗口中显示运行过程的结果。2023/4/15简单程序示例例1.112份肝炎病人血清谷氨酰转移酶(mmol/s)的含量x分别为60、142、195、80、242、220、190、25、212、38、236、95,试计算其均数。程序1.1dataprgl_l;inputx@@;cards;60220190252123823695;procmeans;varx;run;2023/4/15程序结构一个完整的SAS程序一般由数据步(DATASTEP)和过程步(PROCSTEP)两部分组成。数据步以关键词“DATA”开头,过程步以“PROC”开头,以“RUN”结束。PROC为英文单词PROCEDURE的缩写。数据步的作用为指定数据集的名称,定义数据集的变量(如变量名称、变量类型等)和读入原始数据。2023/4/15本例数据步从“dataprgl-l;”开始到数据下面的分号“;”为止结束,建立了名为prgl_l的数据集。过程步的作用是调用现有的SAS过程对指定的数据集进行统计分析。本例过程步执行的是MEANS过程,计算默认数据集(即数据集prgl_1)中数据的例数、均数、标准差、最小值和最大值等统计量。过程步从“procmeans;”开始,到“run;”结束。2023/4/15程序语法规范SAS程序由语句组成,每个语句以“;”作为结束符号。同一行中可以有多个语句,一个语句也可分几行编写,不过一般不宜超过3行。为方便检查和修改,每行可输入一个语句,每个语句中各个元素以一个或几个空格分隔。2023/4/15输入程序语句时,可在光标闪烁处逐个字母输入。一行语句结束后,按“ENTER”换行,继续输入。值得注意的是,CARDS语句后面的数据必须另起一行输入,数据输入完毕后,必须另起一行,输入分号“;”表示数据输入结束。2023/4/15程序运行SAS程序运行后,PROGRAMEDlTOR窗口中的程序语句就消失,OUTPUT窗口显示结果:TheSASSystem23:18Wednesday,July16,20031AnalysisVariable:XNMeanStdDevMinimumMaximum12144.583333380.979748725.0000000242.00000002023/4/15LOG窗口中显示的程序运行信息:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论