数据可视化 课件 第6章 Plotly数据可视化进阶_第1页
数据可视化 课件 第6章 Plotly数据可视化进阶_第2页
数据可视化 课件 第6章 Plotly数据可视化进阶_第3页
数据可视化 课件 第6章 Plotly数据可视化进阶_第4页
数据可视化 课件 第6章 Plotly数据可视化进阶_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1数据可视化第二章plotly基本图形绘制12345线性图条形图饼图甘特图PlotlyExpress2线性图1.31线性图在plotly中对于线性图而言,不是单一的折线图这种,其中包括了散点图,折线图以及两种结合的图形。在plotly中一贯统称为线形图,在plotly中一般用go.scatter来绘制。线性图41线性图散点图散点图,顾名思义就是由一些散乱的点组成的图表,这些点在哪个位置,是由其X值和Y值确定的。所以也叫做XY散点图。而这些散落的点经过散点图描绘之后有的时候可以反映变量之间的相互关系。在plotly中一般用go.scatter命令来绘制,而这个函数对参数的封装往往采用的就是复合字典赋值参数。51线性图散点图中scatter的常用的参数如下:1.mode:图形格式,这个决定包括lines、markers、lines+markers等,但散点图一般指定的是markers.2.x,y:图像上的点的坐标,设置x轴,y轴的坐标数据3.opacity:透明度,取值范围0~14.markes:指定点的颜色,大小以及样式等相关参数,采用复合字典赋值的方法,其中有size,colors,symbol.symbol是设置点的样式。5.name:指定的这条轨迹的名称61线性图准备工作71线性图81线性图散点图91线性图散点图点的基本设置101线性图散点图每个点的基本设置symbol参数赋值为一个数值也可以赋值为一个列表,而用列表的话就是对每个点可以选择不同的样式,但列表元素个数要与点的个数一致。111线性图气泡图气泡图可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,而第三个变量则用气泡的大小来表示。排列在工作表的列中的数据(第一列中列出x值,在相邻列中列出相应的y值和气泡大小的值)可以绘制在气泡图中。气泡图与散点图相似,但气泡图一般反映三维的数据,也可以用于思维数据,而散点图一般常用于二维数据。在气泡图中往往用气泡的大小来作为第三个维度,而在四维气泡图中,一般用透明度,颜色等因素来表示第四维度的数据。在plotly中还是用go.scatter()来绘制气泡图,121线性图三维气泡图131线性图四维气泡图表示方法一141线性图四维气泡图表示方法二151线性图在plotly中还提供一个plotly.express,这个是plotly中一个简易操作的高级界面,可对“整洁”数据进行操作并生成易于样式化的图形。以官网的一个示例给大家展示一下它的效果。161线性图折线图折线图也称线图,折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。171线性图折线图中scatter的常用的参数如下:1.x,y:设置x,y轴坐标数据2.mode:图形格式,lines,markers,text,也可以用lines+markers3.name:线图名称4.opacity:透明度参数,取值范围为0~15.line:线条的设置,包括宽度,颜色格式6.markers:点的格式,设置颜色,大小,格式等181线性图折线图示例1191线性图线图结合201线性图双折线21条形图2.222条形图柱状图也称条形图,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列,或用多维方式表达。有水平条形图,基本柱状图,多组柱状图,层叠柱状图,瀑布柱状图等,在plotly这个第三方库当中,一般用go.Bar()来绘制条形图232条形图Bar()函数一些常用参数:1.base:柱状图起始的参数2.dx,dy:x,y坐标的步进值,默认为13.Marker:数据节点,包括颜色格式等参数,其中包括外围的边框线设置4.orientation:图形显示参数,包括‘v’(垂直模式)和‘h’(水平模式)5.Name:绘制的轨迹名称参数6.Textfont:文本字体参数,包括字体名称,颜色,大小等7.Text:每个柱状图的文本元素8.Textposition:文本元素的位置参数,包括:

"inside"|"outside"|"auto"|"none";9.visible:布尔变量,切换图形显示开关;10.Opacity:柱状的透明度11.Textangle:设置文本的倾斜角度242条形图柱状图常用参数:1.barmode:设置相同坐标的条形图位置。包括:stack(叠加)、group(并列)、overlay(覆盖)、relative(相对);2.bargroupgap:设置相同位置条形图之间的间隙,范围:0-1;3.bargap:设置相邻位置条形图之间的间隙,范围:0-1;4.orientation:图形显示方向参数,包括:v(垂直模式)和h(水平模式);252条形图准备工作262条形图柱状图272条形图柱状簇柱状簇就是多个基本柱状结合而成的,比如要比较两个公司一周内每天销售额的差异,可以利用柱状簇来进行展示和分析,这种柱状簇也可单一的分析某一个类别不同时间的变化,也可以比较不同类别在同一时间上进行的比较。282条形图柱状簇292条形图层叠柱状图层叠柱状图其实类似柱状簇,只不过相当把多个柱状整合为一个,以累加的方式进行叠加,最后转为基本柱状图的形式。唯一和基本柱状图的不同是,它是多个柱体的累加。常用来反映一些金融股票方面在不同形式的资产和负债的分布。302条形图层叠柱状图312条形图水平条形图水平条形图其实和绘制柱状图类似,只不过就是对Bar()中的orientation进行设置,设置显示为水平就可,其他和绘制上面的柱状图,柱状簇,层叠柱状图类似,下面大家可以通过这几个例子进行学习。322条形图水平条形图332条形图水平条形图342条形图瀑布图瀑布图是一种比较常用的柱状图,显示正值(收入)和负值(支出)对总量的贡献来显示结果累积的过程。从这个案例我们可以看出,瀑布图采用绝对值与相对值结合的方式,表达多个特定数值之间的数量变化关系。这种由麦肯锡顾问公司所独创的图表类型,因为形似瀑布流水而被称之为瀑布图。瀑布图具有自上而下的流畅效果,也可以称为阶梯图或桥图,在企业经营分析、财务分析中使用较多,用以表示企业成本的构成、变化等情况。瀑布图可以很好的反映数据在不同时期或受不同因素影响的程度及结果,还可以直观反映出数据的增减变化,在工作表中非常实用。352条形图瀑布图36饼图3.373饼图饼图,或称饼状图,是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系。在饼图中,每个扇区的弧长(以及圆心角和面积)大小为其所表示的数量的比例。这些扇区合在一起刚好是一个完全的圆形。顾名思义,这些扇区拼成了一个切开的饼形图案。在plotly

中一般用pie()函数来绘制饼图,这里的饼图包括基本饼图和环状饼图。饼图383饼图pie()函数常用参数:1.values:每个扇区的数值大小;2.labels:列表,饼图中每一个扇区的文本标签;3.hole:设置环形饼图空白内径的半径,取值0~1。默认值为0,参数是与外径的比值;4.hoverinfo:当用户与图表交互时,鼠标指针显示的参数,包括如下任何组合:"label"、"text"、"value"、"percent","name"、"all"、"none"或"skip",组合时用"+"拼接,默认为"all"。若设置了“none”或“skip”,则鼠标悬停时不会显示任何信息。但是,如果是设置了“none”,则仍会触发单击和悬停事件;5.pull:列表,元素为0~1之间的数值,默认为0,用于设置各个扇区突出显示的本例393饼图pie()函数常用参数:6.sort:布尔变量,是否进行扇区排序7.rotation:扇区旋转角度,范围是0~360,默认值为08.direction:设置饼图方向。clockwise表示:顺时针、counterclockwise(默认)表示:逆时针9.name:名称参数10.opacity:透明度参数,范围是0-111.domain:范围,设置各个扇形的大小12.marker:数据节点参数,包括大小颜色格式等403饼图基本饼图基本饼图是统计分析中的一种常用的图表之一,常用来描绘某一个类别在整体中的占比,比如最常见的性别比例,这个是很典型的示例,通过饼图的面积能够很好的反映占比情况。在plotly中一般用pie()函数。413饼图准备工作423饼图基本饼图1433饼图基本饼图2443饼图基本饼图3453饼图环形饼图环形图与饼图类似,但又有区别。环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于构成的比较研究。通俗的来讲环形饼图就是图表中的‘甜甜圈’,其实环形饼图和基本饼图在绘制中是类似的,不过环形饼图相对饼图来说就多一个空洞形式。463饼图环形饼图47甘特图4.484甘特图甘特图又称为横道图,通过条形来显示项目的进度、时间的安排等与时间相关的情况。甘特图能够很直观反映项目安排以及项目进展这些内容。在plotly这个第三方库中,用的函数是plotly.figure_factory

中的create_gantt函数,通过参数事件Task,开始Start,结束Finish的时间的数据来绘制甘特图。甘特图494甘特图create_gantt函数常用参数:1.df:任务名称起止时间2.colors:每个任务的颜色3.index_col:索引方式,常用的有数字索引和类别索引、4.show_colorbar:是否显示图例,True和False5.showgrid_x,showgrid_y:设置是否显示横纵坐标轴6.title:甘特图的名称7.bar_width:项目条的宽度504甘特图514甘特图524甘特图数字索引数字索引简单点的来说就是将传入的数据按照数字索引方式对任务进行分类,这个数字是每个项目的进度,具有相同索引值的条形将会呈现相同的颜色,也可以说通过颜色来判断项目完成的进度。534甘特图数字索引544甘特图类别索引除了数字索引这种方式,还有一种比较常用的索引方式是类别索引,就是将所有的项目分为未完成,完成,进行中这三种类别,通过不同颜色对这些类别进行分类,可以直观的分析项目进展,及时的对项目进行重新安排和调整。554甘特图类别索引56PlotlyExpress5.575PlotlyExpressPlotlyExpress是Plotly.py的高级封装,它为复杂的图表提供了一个简单的语法。这个是在plotly基础上对它进行更高级的封装,简化了plotly绘制图表命令,让绘制图表更加的简单。在plotly4.0版本出现后,plotlyexpress属于plotly这个绘图库的一部分,在每个PlotlyExpress函数都会返回一个graph_objects.Figure对象,该对象的data和layout已根据提供的参数进行了预填充。而且它还在内部封装一些默认的数据集,方便初学者学习,是一个很方便的绘图库。PlotlyExpress585PlotlyExpress内置数据集Plotlyexpress中提供了几个常用来做统计分析的数据集:gapminder,wind,iris,tips,election,carshare,tips这几个数据集,类似python的另一个绘图库Seaborn,通过相应的命令导入,然后数据框格式的数据。595PlotlyExpress内置数据集605PlotlyExpress导入数据集615PlotlyExpress主题调色板在plotlyexpress中主题是指控制图形范围的设置,如边距、字体、背景颜色、刻度定位等。可以使用模板参数应用任何命名的主题或主题对象:有三个内置的Plotly主题可以使用,分别是plotly,plotly_white和plotly_dark。是通过template这个参数来改变。PlotlyExpress将使用活动模板的layout.colorway属性中的颜色顺序,默认活动模板是plotly使用plotly颜色顺序的颜色。但是,可以从px.colors.qualitative模块中选择以下任何内置定性颜色序列,或者定义自己的颜色序列。625PlotlyExpress调色板635PlotlyExpress案例示范以plotlyexpress中tips数据集为例。total_bill:总费用tip:小费 Sex:性别Smoker:是否吸烟 Day:就餐星期中哪一天Time:就餐的时间Size:就餐的人数645PlotlyExpress总消费和小费,性别之间的关系655PlotlyExpress总消费和小费,性别之间的关系665PlotlyExpress总消费和小费,性别之间的关系675PlotlyExpress小提琴图提琴图是一种用于显示数据分布及其概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表95%置信区间,而白点则为中位数。在统计分析中,小提琴图是一种很常用的图形,在plotlyexpress中也提供了这种图的绘制,用的是violin()函数。685PlotlyExpressviolin()函数常用参数:1.dataframe:需要分析的数据(数据框形式)2.x:选取某一列,小提琴也沿x轴显示3.y:选取某一列,默认小提琴也沿y轴显示4.color:分配的颜色5.box:布尔值–如果为True,则在小提琴内部绘制框。6.orientation

:–

'h'水平或'v'垂直之一695PlotlyExpressviolin()函数常用参数:7.points

:outliers','suspectedoutliers','all',或False。如果为

'outliers',则仅显示外部的采样点。如果显示'suspectedoutliers',则显示所有离群点,并用标记突出显示小于4*Q1-3*Q3或大于4*Q3-3*Q1的点'outliercolor'。如果为'outliers

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论