《数据可视化技术》 课件 01 分析电影评论数量_第1页
《数据可视化技术》 课件 01 分析电影评论数量_第2页
《数据可视化技术》 课件 01 分析电影评论数量_第3页
《数据可视化技术》 课件 01 分析电影评论数量_第4页
《数据可视化技术》 课件 01 分析电影评论数量_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据可视化技术》课程介绍课程模块和项目序号模块名称项目名称学时1Matplotlib数据可视化豆瓣电影数据分析与Matplotlib可视化162Echarts数据可视化电商销售数据Echarts可视化363Flask+Echarts数据可视化高校招生就业数据分析与可视化招聘数据分析与可视化44合

计96课程介绍课程目标主要面向数据可视化工程师岗位,通过学习Python、Matplotlib、Flask、Echarts和Web前端技术,将爬取或采集下来的数据进行存储、处理和分析,并以各种图表的形式进行呈现和展示。重点使用Python进行数据分析、Matplotlib和Flask+Echarts进行可视化展现,形成图表,并利用Web页面展示出来。课程介绍课程考核平时成绩(60%)+期末考试(40%)平时成绩:学习考勤(10%)、综合素养(10%)、平时训练任务(40%)期末考试:上机技能测试阶段测试(综合能力)项目介绍本次课开始学习项目一:影评数据分析与可视化本项目从某电影网站采集了电影《流浪地球》的部分评论数据,包括城市、影评内容、评分、评论时间、评论点赞数等,根据采集的数据对电影评论的数量、点赞数和评分三个方面进行分析,完成数据分析可视化,给对科幻电影感兴趣的观影者、电影投资者提供一些参考。单元1分析电影评论数量01准备活动点名、复习本次课学习内容、学习目标介绍学习内容任务一分析电影评论数量本任务从评论日期、评论者所在城市和星级评分三个方面来分析电影评论数量。通过绘制折线图、柱状图和饼图,对电影评论数量的情况进行对比分析,这有利于全面挖掘该电影的口碑、观影热度、观众对电影的理解等信息,为观众提供观影参考。子任务1影评数量随日期变化的情况分析(折线图)任务分解:子任务2影评数量最多的十个城市情况分析(柱形图)子任务3评分星级数量占比情况分析(饼图)学习目标1、知识(1)理解数据分析以及数据分析流程(2)掌握pandas库的基本操作、数据处理基本的选取、统计等函数(3)掌握matplotlib库绘制图形的基本方法,以及折线图、柱状图、饼图绘制方法2、技能(1)能使用pandas库读取文本数据,按照任务要求处理数据(2)能使用matplotlib子库plotlib根据数据绘制折线图、柱状图、饼图3、素养(1)分析问题的能力;(2)团队沟通能力;(3)培养团队合作意识。02发展活动任务分析、任务资讯、任务实施子任务1:影评数量随日期变化的情况分析任务分析:根据评论时间字段times提取日期(只提取年月日)数据并统计出各日期的评论数量,绘制折线图,显示评论数量随日期的变化情况。1.Matplotlib概述任务资讯Matplotlib是一款用于数据可视化的Python软件包,支持跨平台运行,它能让使用3项目1影评数据分析与可视化者很轻松地将数据图形化,并且提供多样化的输出格式,可以绘制线图、散点图、等高线图、条形图、柱状图、3D图形,甚至图形动画等。常用的数据可视化图表有直方图、柱状图、折线图、散点图、饼图等,如图1-1-1所示。2.Matplotlib下载与安装任务资讯3.pyplot绘图流程任务资讯第1步:导入模块。第2步:准备数据。第3步:画布子图。第4步:绘制图形。第5步:添加标签。第6步:保存显示。4.折线图任务资讯折线图是以折线的上升或下降来表示统计数量增减变化的统计图,它可以直观地反映数据的变化趋势。pyplot模块中plot()函数一般用于绘制线条,包括折线和直线。示例:任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图的常用参数值.步骤2:统计各日期的评论数量。提取评论时间的日期信息,并统计各日期电影评论数量。步骤3:绘制折线图。使用Matplotlib绘制折线图,横轴为日期,纵轴为日期所对应的电影评论数量,显示各日期的评论数量以及变化趋势。子任务2影评数量最多的十个城市情况分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,统计各城市评论数量。根据所统计各城市评论数量,使用Matplotlib绘制柱状图,要求横轴为城市,纵轴为城市对应的电影评论数量,显示评论数量最多的十个城市的情况。1.柱形图任务资讯柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制(水平绘制叫条形图)。柱状图显示了不同类别之间的比较关系,它由一系列高度不等的纵向条纹表示数据分布的情况。图表的水平轴x表示被比较的类别,垂直轴Y则表示具体的类别值。pyplot模块中的bar()函数用于绘制柱状图,barh()函数用于绘制条形图。示例:显示2022年不同种类(A、B、C、D)的销售数量,通过bar()函数绘制柱状图,代码如下:任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值。步骤2:统计并取出评论数量最多的十个城市步骤3:绘制柱状图。横轴为城市,纵轴为城市对应的电影评论数量,显示评论数量最多的十个城市子任务3评分星级数量占比情况分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,从评论评分字段scores统计各评分的评论数量。根据统计出的各评分星级数量,使用Matplotlib绘制饼图,显示各星级评分的占比情况。1.饼图任务资讯饼图用来显示一个数据系列,具体来说,饼图显示一个数据系列中各项目占项目总和的百分比。饼图可以清楚地反映部分与部分、部分与整体之间的比例关系,能直观地显示每组数据相对于总数的大小和占比情况。pyplot模块中的pie()函数用以绘制饼状图,语法格式如下1.饼图任务资讯pyplot模块中的pie()函数用以绘制饼状图,语法格式如下示例:显示2022年不同种类(A、B、C、D)的销售数量的占比情况,通过pie()函数绘制饼图,代码如下任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论