阿里助理工程师ACA考试真题题库六_第1页
阿里助理工程师ACA考试真题题库六_第2页
阿里助理工程师ACA考试真题题库六_第3页
阿里助理工程师ACA考试真题题库六_第4页
阿里助理工程师ACA考试真题题库六_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:阿里助理工程师ACA考试阿里助理工程师ACA考试真题题库六PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages阿里助理工程师ACA考试真题题库六第1部分:单项选择题,共85题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.某大型企业计划使用MaxCompute对本公司的数据进行加工和分析,预计该项目会有上万个表、数千个任务,同时有近40人的团队负责该项目的建设和运维。从工程角度出发,()可以大大减少项目管理和建设的成本。A)使用DataWorksB)直接在MaxCompute上开发,使用脚本定时调度任务C)使用eclipseD)自己研究开发一个平台,专门支持该项目答案:A解析:[单选题]2.DataWorks运维中心周期任务运维中,如果将当前节点置为暂停(冻结)状态,以下说法正确的是?A)仍会调度当前任务生成的实例B)暂停后,正常生成实例C)暂停后,不会生成实例D)仍会调度下游依赖实例答案:B解析:[单选题]3.DataWorks业务流程能够根据业务种类组织不同类用的节点,以业务为单元开发代码,关于DataWorks业务流程的节点说法错误的是?A)可通过拖拽管理节点B)不包括虚拟节点C)包括跨租户节点D)包括数据同步节点答案:D解析:[单选题]4.DataV在制作可视化大屏时,基本的交互式操作时通过()实现的。A)回调IDB)大屏触摸C)系统时间参数D)暂时不支持交互答案:A解析:[单选题]5.某公司采用阿里云DataWorks实现了数据分析的功能,因为业务变化而调整了某数据表的表结构,业务人员需要了解哪些相关表格受到了影响。此时可以采用DataWorks的()解决这个问题。A)个性化的数据收藏功能B)灵活的角色管理,数报授权管理功能C)数据处理代码的版本管理功能D)可视化的血缘分析功能答案:D解析:[单选题]6.在DataWorks中,()是指使用系统或计算资源的客户,即公司A)DataWorks项目B)MaxCompute项目空间C)组织D)个人账号答案:C解析:[单选题]7.DataWorks调度配置中可以设置?重跑?和?出错自动重跑?,当?重跑?属性设置为以下哪种时,"出错自动重跑?属性不会显示出来?A)运行成功或失败后皆可重跑B)运行成功后不可亚跑C)运行失败后可以重跑D)运行成功或失败后皆不可重给答案:D解析:[单选题]8.DataWorks是阿里云重要的PaaS平台产品,为您提供数据集成,数据开发、数据地图、数据质量和数据服务等全方位的产品服务,以下属于DataWorks使用场景的是?A)存储海量的数据,进行数据的清洗B)使用DataWorks,对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发C)对数据进行离线计算D)直接把计算的结果显示出来答案:B解析:[单选题]9.大数据,指的是所涉及的数据量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策的资讯。以下哪一个不属于大数据的4V特征?A)Volume数据体量大B)Velocity数据变化快C)Value价值密度高D)Variety数据类型多答案:C解析:[单选题]10.当上传本地文件到QuickBI中做展现时,数据被保存到了()。A)QuickBI自带的探索空间B)QuickBl自带的MaxComputeC)AnalyticDBD)客户端本地缓存答案:A解析:[单选题]11.回归属于有监督学习算法,以下哪个不属于回归算法应用的场景?A)根据新输入父亲的身高来分析其孩子的身高B)分析用户是否会购买电脑C)根据现有房价信息,预测未来的房价D)根据历史的天气数据,预测未来的天气答案:A解析:[单选题]12.分类属于有监督学习算法,以下哪个不属于分类算法应用的场景?A)分析用户是否会购买电脑B)分析用户是否会点击弹出的广告C)分析收到的邮件是否是垃圾邮件D)根据新输入父亲的身高来分析其孩子的身高答案:D解析:[单选题]13.按照学习方式不同进行分类,以下哪个不属于机器学习的分类?A)监督学习B)无监督学习C)半监督学习D)全监督学习答案:D解析:[单选题]14.机器学习PAI(PlatformofArtificialIntelligence)是阿里云人工智能平台,提供一站式的机器学习解决方案。以下哪个不属于机器学习平台PAI的基础设施?A)CPU集群B)GPU集群C)自建集群D)FPGA集群答案:C解析:[单选题]15.根据学习样本数据不同,对问题有不同的建模方式,以下哪个是对监督学习的描述?A)学习样本中有结果标记B)学习样本中无结果标记C)学习样本中部分记录有结果标记D)学习样本中自动学习结果的标记答案:A解析:[单选题]16.DataV制作的大屏通过()可以把作品嵌入到企业已有的门户中去。A)发布后的urlB)预览时的urlC)发布后得到的MD5码D)发布后导出的jar包答案:A解析:[单选题]17.阿里云QuickBI报表工具支持多种数据源,方便用户基于自己来自不同数据源的数据进行分析和展现。目前还不支持()作为数据源。A)API调用返回结果B)MaxComputeC)本地Excel文件D)MySQL版RDS答案:A解析:[单选题]18.组织管理是QuickBI提供的功能,为用户提供了数据协同开发的能力。以下关于组织管理的描述错误的是?A)组织成员管理工作就是负责把需要在该组织中进行协同工作的阿里云用户加到组织中B)在组织展而,只有两种组织角色:组织管理员和普通用户C)组织创建者默认就是组织管理员D)普通用户可以访问组织成员管理功能模块答案:D解析:[单选题]19.DataWorks中提供了简单模式和标准模式两种工作空间模式。关于两种模式,以下描述哪个是错误的?A)简单模式是指一个Dataworks工作空间对应一个MaxCompute项目B)标准模式是指一个Dataworks工作空间对应两个MaxCompute项目C)简单模式可以升级为标准模式:标准模式也可降级为简单模式D)标准模式下,开发环境默认不开启任务调度,游免开发环境的任务周期运行时,和生产环境的任务抢夺资调答案:C解析:[单选题]20.DataWorks数据集成主要用于离线(批量)数据同步。下列关于离线同步说法正确的是?A)只能实现结构化数据源的传输B)只支持关系型数据库MySQLRDS等C)数据集成不仅完成数据同步(传输),还提供数据流的消费方式D)离线数据同步主要由三部分组成:Reader.Channel.Writer答案:D解析:[单选题]21.MaxCompute的连接使用方式有多种,其中可以配置依赖、调度的方式是()。A)使用DataWorksB)使用IntelijiDEAC)使用MaxComputeConsoleD)目前暂无工具支持答案:A解析:[单选题]22.MaxCompute架构由四层组成,每一层完成不同的工作。现在执行命令"selectcount(*)fromtable_a?,最终由()处理该命令并返回结果。A)计算层B)客户端C)接入层D)逻辑层答案:A解析:[单选题]23.使用odpscmd连接到MaxCompute中的某个project后,执行命令()可以查看表table_a占用空间的大小。A)desctable_a;B)sizetable_a;C)selectsizefromtable_a;D)showtabletablea:答案:A解析:[单选题]24.MaxCompute提供了多种针对日期的计算函数,以下函数中,能实现计算两个时间的差的是()。A)datediffB)timestampdiffC)intervalD)直接相减答案:A解析:[单选题]25.使用MaxComputeSQL更新数据时,以下说法中不正确的是〔)。A)使用动态分区插入数据时,需在语句中指定分区值。且只要出现在select子句中最后一个位置即可,也可为该值指定一个易于识别的别名B)进行insert更新数据操作时,源表与目标表的对应关系依赖于在select子句中列的顺序,而不是表与表之间列名的对应关系C)向某个具体的分区插入数据时。分区列不允许出现在select列表中D)支持在一个语句中实现读取一次写入多个目标表的操作答案:B解析:[单选题]26.关于MaxComputesQL中分区的说法,以下错误的是哪一项?A)使用MaxComputeSQL添加分区时,一次只能添加一个分区B)使用MaxComputeSQL删除分区时,一次可以删除多个分区C)对于多级分区的表,如果需要添加新的分区,必须指明全部的分区值。D)添加分区时,如果未指定IFNOTEXISTS而同名的分区已存在,则返回报错。答案:A解析:[单选题]27.大数据面临着一些技术性难题,其中一个是海量数据的存储,目前主流的处理方式是通过()来解决。A)共享存储系统B)分布式存储系统C)网络文件系统D)本地文件系统答案:B解析:[单选题]28.使用DataWorks进行数据开发时,可以创建不同的任务。如果某任务内需要多节点配合并包含表示依赖关系的连线,则该任务的美型是(.A)节点任务B)工作流任务C)多节点任务D)多工作流任务答案:B解析:[单选题]29.MaxCompute中有两种快捷建表方法,一种是使用AS,一种是使用LIKE,即createtablenew_table_nameas/like。关于这两种方式的说法中正确的是门.A)使用as能根据其后的SQL带入数据到新建的表中,使用like只能建空表B)使用as能保留源表的分区属性,但是无法保留Ilifecycle属性C)使用like能保留源表的所有属性,包括lifeccycle、注释、分区等D)使用like可以依赖于多张源表。使用as只能依赖于一张表答案:A解析:[单选题]30.MaxCompute中的表t_dml中仅包含一个字段id,类型为string。以下SQL中肯定会报错的是()A)insertintotablet_dmlvalues(2');B)insertoverwritetablet_dmlselect3.14fromdual;C)createtablet_dml_bakliket_dmll;D)createtablet_dml_bakassellect*fromt_dml;答案:A解析:[单选题]31.Tom是MaxCompute中某个项目空间pri1的管理员。该项目空间有很多敏感数据,比如用户身份号码和薪资记录,还有很多自主知识产权的数据挖掘算法。Tom希望能将项目空间中的这些敏感数据和算法保护好,项目中用户只能在项目空间中访问,数据只能在项目空间内流动。他应该怎么操作?A)使用AGL授权将所有用户设西为只读B)使用Policy授权将所有用户设置为只读C)允许对象创建者访问对象D)开启项目空间的数据保护机制答案:D解析:[单选题]32.可以通过修改文件odps_config.ini来配置MaxCompute的客户端工具odpscmd,()是不能使用默认值必须要修改的。A)project_nameB)log_view_hostC)https_checkD)access_id答案:D解析:[单选题]33.DataWorks的数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。不支持下列哪一种类型的数据同步到MaxCompute?A)RDS中的数据B)半结构化C)结构化数据D)OSS中存放的非结构化教据答案:B解析:[单选题]34.DataWorks提供的依赖关系配置模式不包括?A)自动推荐B)自动解析C)自定义配置D)随机配置答案:D解析:[单选题]35.在EDataWorks中,需要为每个项目指定一个计算引擎,即该项目中的数据存储和处理将使用该指定的计算引擘,关于计算引学的说法中最准确的是(j.A)支持HadocpMapReduce作为计算引擎B)只能使用已创建项日的MaxCompute作为计算引擎C)只能技用包年包月形式的MMaxCompute作为计算引擎D)支持MaxCompute,E-MapReduce,机器字习PAI等多科引擎答案:D解析:[单选题]36.大数据存储一般采用的是分布式存储技术,以下关于分布式存储说法正确的是?A)Hadoop的分布式存储技术是G于SB)分布式存铭要求威层有多台高性能存储服务器C)分布式存储实现数据冗余,提高了数据的安全性D)分布式存储方式无法存鳍传统的结构化歌据答案:C解析:[单选题]37.QuickBI提供拖拽式操作和丰富的可视化效果,以下关于QuickBI的描述错误的是?A)支持多种类型数据源。支持多种可视化阻悴B)海量数据的脔线分析,提俱暂能的一键加速C)灵活的服表集成方案,严密的安全权限曾理D)门氆低易上手省时向答案:B解析:[单选题]38.评估指标用于判断算法的性能,以下哪个不属于分类算法的评估指标?A)精确率B)召回率C)可解释性D)F1-Score答案:C解析:[单选题]39.阿里云的机器学习平台提供了大量实用的算法,包括数据预处理方法,常用的归一化"处理主要是().A)把指定数据设置为1B)把指定数据设置为平均值C)封数钢的线性资换,使结里值映射到[0-1]之问D)对>1的数据设置为1答案:C解析:[单选题]40.交互式实时数据可视化应用来帮助业务人员发现并诊断业务问题,越来越成为大数据解决方案中不可或缺的一环。为了实现这些新的需求,可以使用以下哪个阿里云服务?A)大歌据计算服务MaxComputeB)数据工场DataWorkcsC)云原生数据仓库(分析国数据库)AnalytieDBD)DataV数据可视化答案:D解析:[单选题]41.DataWorks中,运维中心的任务管理视图以()的方式显示调度任务之间的依赖关系和运行约束。A)平衡树B)DAG图C)双向列表D)二叉倒答案:B解析:[单选题]42.工作空间是DataWorks管理任务、成员,分配角色和权限的基本单元。以下关于工作空间说法正确的是?A)工作空阿管理员可以加入或员李工作空问B)-个工作间只支持填定MaxComputs关型的计算引擘实例C)工作空问是某个任务在某时某刻执行的一个快照D)工作空阿定义了开发的节点任务。业务疏程,从DataWorks开发环境发布至调度素统的过程答案:D解析:[单选题]43.MaxCompute中有两种快捷建表方法,一种是使用AS,一种是使用LIKE,即createtablenew_table_nameas/like...。关于这两种方式的说法中正确的是().A)使用能根据其后的SQL带入数据到新建的表中,使用ke只能建空表B)使用3s能保留源表的分区属性,但是无法保留litecycle国性C)使用nRe能保留源表的所有赢性,包括ideccycle。注择。分区等D)使用k毫可以债接于多张源表,使用33只能依骏于一张表答案:A解析:[单选题]44.在MaxCompute的命令行中,如果想查看某个项目空间的所有表,可以执行().A)listtables;B)usetables;C)desctables;D)showtables;答案:D解析:[单选题]45.MaxCompute是阿里自研的一种快速、完全托管的EB级数据仓库解决方案,以下哪个是MaxCompute的基本计算单元,开且SQLHOMR都是通过真来执行的?A)实例B)任务C)表格D)资源答案:B解析:[单选题]46.在MaxCompute中,可以通过Tunnel命令行来完成数据的上传下载。如果要下毂test_project项目空间下的一个带分区的表test_table_p的内容到log.txt文件中,使用命令tunneldownloadtest_project.test_table_plog.txt;结果报错,其中出错的部分为()A)tunneiB)downloadC)test_peoject.test_table_pD)log.txt答案:C解析:[单选题]47.使用MaxComputeSQL更新数据时,以下说法中不正确的是().A)使用动态分区播入数据时,需在语句中指定分区值,且只要出现在select子旬中最后一个位置即可,也可为该值指瘤一个易于识别的别名B)进行insert更新数珮操作时,源表与目标表的对应关系依赖于在select子句中列的顺歧,而不是表与表之间列名的对应关结C)政某个具体的行区插入数据时,分区列不北许出现在s电ee列表中D)支持在一个语甸中实现读取一次写入多个目标表的授作答案:A解析:[单选题]48.大数据4V特征之一是"Value?,表明大数据本身具有价值,其提供的核心价值是(A)洞察与预测B)存储与计算C)资源优化配置D)传统企业转型.答案:A解析:[单选题]49.DataWorks可以提升对业务数据的分析能力并进行有效监控,更好地业务赋能。这体现了DataWorks的哪一种能力?A)日志大数据分析B)精细化运营C)敌据安全管理D)数钢收集和存鳍答案:B解析:[单选题]50.Tom是MaxCompute中某个项目空间pr1的管理员。该项目空间有很多敏感数据,比如用户身份号码和薪资记录,还有很多自主知识产权的数据挖狙算法。Tom希望能将项目空间中的这些敏感数据和算法保护好,项自中角卢只能在项自空间中访问,数据只能在项目空间内流动,他应该怎么操作?A)使用ACL授叹将所有用户设置为只读B)使用Policy经投素所有用户设置为只读C)允许对象创建者访问时象D)开启项目空阿的数剩保护机制答案:D解析:[单选题]51.MaxCompute表支持生命周期管理,即表中的数据从最后一次更新时间算起,在经过指定的时间后没有变动,则此表将被MaxCompute自动回收。以下说法中正确的是()。A)对于某非分区表,一旦其lifecyele值指宝的时间段内来更新,则该表焖棱自动蒯除B)建表时可以指定ifecyele,其单位为小时。其取值必频为正整致C)可以给不同的表或者不同的分区指定不同的生命周刻lifecycle值D)对于某分区表。一旦其tlifecyclef值指定的时问段内未有任何分区数露发生过更新,则该表将被自动蒯除答案:A解析:[单选题]52.DataWorks数据集成主要用于离线(批量)数据同步。下列关于离线同步说法正确的是?A)只能实现结构化数据源的传输(结构化(例如RDS、DRDS等)、半结构化、无结构化)B)只支持关系型数据库MySQL,ROS等C)数据集成不仅完成数据同步(传输),还提供数据流的消费方式D)离线数据同步主要由三部分组成:Reader,Channel,Writer答案:D解析:[单选题]53.使用DataWorks进行购野开发时,可以创建不同的任务。如果某任务内需要多节点配合并包含表示依赖关系的连线则该任务的类型是()。A)节点任务B)工作流任务C)多节点任务D)多工作流任务答案:B解析:[单选题]54.某大型企业计划使用MaxCompute对本公司的数据进行加工和分析,预计该项目会有上万个表、数干个本题分信任务,同时有近4人的团队负责该项目的建设和运维。从工程角度出发,()可以大大减少项目管理和建设的成本。A)使用DataWorksB)直接在MaxCompute上开发,使用脚本定时调度任务C)使用eclipseD)自己研究开发一个平台,苟卫氓该项目答案:A解析:[单选题]55.DataV在制作可视化大屏时,基本的交互式操作时通过()实现的。A)回调lDB)大屏触摸C)系统时间参数D)暂时不支持交互答案:A解析:[单选题]56.某公司采用阿里云DataWorks实现了数据分析的功能,因为业务变化而调整了某数据表的表结构,业务人员需要了解哪些相关表格受到了影响。此时可以采用DataWorks的()解决这个问题。A)个性化的数据收藏功能B)灵活的角色管理、数据授权管理功能C)数据处理代码的版本管理功能D)可视化的血缘分析功能答案:D解析:[单选题]57.在DataWorks中,()是指使用系统或计算资源的客户,即公司。A)DataWorks项目B)MaxCompute项目空间C)组织D)个人账号答案:C解析:[单选题]58.DataWorks调度配置中可以设置重跑和?出错自动重跑',当重跑'属性设置为以下哪种时,?出错自动重跑'属性不会显示出来?A)运行成功或失败后皆可重跑B)运行成功后不可重跑C)运行失败后可以重跑D)运行成功或失败后皆不可重跑答案:D解析:[单选题]59.DataWorks是阿里云重要的PaaS平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,以下属于DataWorks使用场景的是?A)存储海量的数据,进行数据的清洗B)使用DataWorks,对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发C)对数据进行离线计算D)直接把计算的结果显示出来答案:B解析:[单选题]60.DataV数据可视化是使用可视化应用的方式来分析并展示庞杂数据的产品,以下哪个应用场景不是使用DataV可以实现的?A)开发天猫双11、阿里云城市大脑同款数据可视化应用B)开发工业级的数据可视化项目C)搭建专业级地理信息可视化应用D)搭建企业级数据分析平台答案:D解析:[单选题]61.按照学习方式不同进行分类,以下哪个不属于机器学习的分类?A)监督学习B)无监督学习C)半监督学习D)全监督学习答案:D解析:[单选题]62.机器学习PAI(PlatformofArtificialIntelligence)是阿里云人工智能平台,提供-站式的机器学习解决方案。以下哪个不属于机器学习平台PAI的基础设施?A)CPU集群B)GPU集群C)自建集群D)FPGA集群答案:C解析:[单选题]63.DataV制作的大屏通过()可以把作品嵌入到企业已有的门户中去.A)发布后的urlB)预览时的urlC)发布后得到的MD5码D)发布后导出的JAR包答案:A解析:[单选题]64.阿里云QuickBl报表工具支持多种数据源,方便用户基于自己来自不同数据源的数据进行分析和展现。目前还不支持()作为数据源。A)API调用返回结果B)MaxComputeC)本地Excel文件D)MySQL版RDS答案:A解析:[单选题]65.组织管理是QuickBI提供的功能,为用户提供了数据协同开发的能力。以下关于组织管理的描述错误的是?A)组织成员管理工作就是负责把需要在该组织中进行协同工作的阿里云用户加到组织中B)在组织层面,只有两种组织角色:组织管理员和普通用户C)组织创建者默认就是组织管理员D)普通用户可以访问组织成员管理功能模块答案:D解析:[单选题]66.DataWorks中提供了简单模式和标准模式两种工作空间模式。关于两种模式,以下描述哪个是错误的?A)简单模式是指-个Dataworks工作空间对应一个MaxCompute项目B)标准模式是指-个Dataworks工作空间对应两个MaxCompute项目C)简单模式可以升级为标准模式;标准模式也可降级为简单模式D)标准模式下,开发环境默认不开启任务调度,避免开发环境的任务周期运行时,和生产环境的任务抢夺资源答案:C解析:[单选题]67.MaxCompute的连接使用方式有多种,其中可以配置依赖、调度的方式是()。A)使用DataWorksB)使用IntelijIDEAC)使用MaxComputeConsoleD)目前暂无工具支持答案:A解析:[单选题]68.MaxCompute架构由四层组成,每一层完成不同的工作。现在执行命令"selectcount(*)fromtable_a",最终由()处理该命令并返回结果。A)计算层B)客户端C)接入层D)逻辑层答案:A解析:[单选题]69.关于MaxComputeSQL中分区的说法,以下错误的是哪一项?A)使用MaxComputeSQL添加分区时,--次只能添加个分区B)使用MaxComputeSQL删除分区时,-次可以删除多个分区C)对于多级分区的表,如果需要添加新的分区,必须指明全部的分区值。D)添加分区时,如果未指定IFNOTEXISTS而同名的分区已存在,则返回报错。答案:A解析:[单选题]70.大数据面临着一些技术性难题,其中一个是海量数据的存储,目前主流的处理方式是通过()来解决。A)共享存储系统B)分布式存储系统C)网络文件系统D)本地文件系统答案:B解析:[单选题]71.阿里云大数据体系由多个大数据组件组成,下列技术中,哪一个属于阿里云大数据体系?A)YarnB)ZooKeeperC)PigD)DataWorks答案:D解析:[单选题]72.大数据存储一般采用的是分布式存储技术,以下关于分布式存储说法正确的是?A)Hadoop的分布式存储技术是GFSB)分布式存储要求底层有多台高性能存储服务器C)分布式存储实现数据冗余,提高了数据的安全性D)分布式存储方式无法存储传统的结构化数据答案:C解析:[单选题]73.使用DataWorks进行购野开发时,可以创建不同的任务。如果某任务内需要多节点配合并包含表示依赖关系的连线则该任务的类型是()A)节点任务B)工作流任务C)多节点任务D)多工作流任务答案:B解析:[单选题]74.MaxCompute中荀晒由皿表方法,一种船吏用AS,一种是使用LIKE,即createtablenew_table_nameas/like...。关千这两种方式的说法中正确的是().A)使用as能根据其后的SQL带入数据到新建的表中,使用like只能建空表B)使用as能保留源表的分区属性,但是无法保留lifecycle属性C)使用like能保留源表的所有属性,包括llfeccycle、注释、分区等D)使用like可以依赖千多张洹表,使用as只能依赖千一张表答案:A解析:[单选题]75.MaxCompute中的表tdml中仅包含一个字段id,类型为string.以下SQL中肯定会报错的是()。A)insertintotabletdmlvalues(2);B)insertoverwritetablet_dmlselect3.14fromdual;C)createtablet_dmlbakliketdml;D)createtablet_dmlbakasselectfromtdml;答案:A解析:[单选题]76.大数据集群中的硬件资源可能是数以万计的,如何管理协调、充分利用硬件资源成为一个很重要的问题,各种流行的大数据技术都有自己核心的资源管理和调度模块。以下选项中()不是负责类似功能的。A)盘古B)YARNC)伏羲D)Mesos答案:A解析:[单选题]77.DataWorks支持数据分析项目的全流程开发,以下的说法中不正确的是()。A)开发人员在数据开发和数据管理模块中完成数据输入,数据加工,数据输出等工作B)部署或是运维人员可以根据最新的开发结果生成发布包C)部署人员或是运维人员可以通过发布管理模块完成发布包发布D)运维人员可以在运维中心模块中,监控生产环境下的数据运行情况答案:B解析:[单选题]78.采用分布式的方式存储数据时,要考虑数据复制时一致性的问题,关于一致性如何保证可以采取多种基本原则和设计理念,不包括()。A)LRUB)CAPC)ACIDD.BASE答案:A解析:[单选题]79.某公司码农小王,熟悉公司业务以及业务系统中的数据,但不具备设计能力。现在他想为公司设计一个分析型的可视化大屏,为了保证设计效果不会太糟,他可以选用DataV中的()来实现。A)模板B)自动排版C)地图套件D)portal答案:A解析:[单选题]80.MaxComputeSQL采用的是类似于SQL的语法,降低了MaxCompute的使用门槛。关于MaxComputeSQL,说法正确的是()。A)严格来讲MaxComputeSQL只是使用MaxCompute的一个手段,MaxCompute并不具备数据库的常见特征,如事务、约束、ACID一致性原则等B)支持标准QLMySQL语法的SQL语句可以直接在MaxCompute中运行C)支持视图、索引,但是不支持事务D)支持更新表中的数据,包括使用insertoverwrite票盖、delete制除,但是不支持update语句的更新答案:A解析:[单选题]81.在DataWorks中,任务节点/工作流任务可以配置跨周期依赖,如果任务A和B都是按小时调度,任务B配置依赖任务A的上周期,则()。A)任务B的实例都将依赖A昨天所有实例B)任务的实例都依赖与B同周期的前一个周期C)任务B的实例都将依赖A昨天所有实例和A与B同周期的前一个周期实例D)任务B的实例都将依赖A昨天所有实例和A与B同周期的前一个周期实例答案:B解析:[单选题]82.大数据计算服务MaxCompute是阿里巴巴自主研发的海量数据处理平台,主要服务于批量结构化数据的存储和计算。以下哪个场景不适合使用大数据计算服务实现?A)订单办理B)数据仓库C)社交网络分析D)用户画像答案:A解析:[单选题]83.某数据集包含以下项(时间,区域.销售金额)想通过一张图表把上述信息全部展示出来,适合使用()。A)气泡图B)树图C)饼图D)雷达图答案:A解析:[单选题]84.MaxCompute的分区表指的是在创建表时指定某几个字段作为分区列,从而实现将表的数据分成多个分区。关于分区的说法中,不正确的是()。A)MaxCompute将分区列的每个不同取值作为一个分区B)分区列对字段类型没有要求C)用户可以指定多级分区D)在使用数据时如果指定了需要访问的分区名称,则只会读取相应的分区,避免全表扫描答案:B解析:[单选题]85.某企业根据用户历史购买信息和点击信息生成了一个决策树模型,该模型可以判断点击过的用户是否会购买自己公司的产品。这个案例使用了大数据分析的()技术。A)分类B)聚类C)关联分析D)时序分析答案:A解析:第2部分:多项选择题,共37题,每题至少两个正确答案,多选或少选均不得分。[多选题]86.MaxComputeSQL中的join操作经常会被用到,但是使用join有一些限制条件,即只有满足了这些条件,才能使用,这些条件包括().A)关联条件爱为等值连接B)多个条件之间需用and连接C)有非等值连接D)or连接的关联条件答案:AB解析:[多选题]87.大数据(BigData),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。以下哪些属于大数据的处理思路?A)复杂问题简单化B)一个大问题拆分成多个小问C)复杂问题作为一个整体进行分析D)小问题直接忽略不计答案:AB解析:[多选题]88.在MaxComputeSQL中可以通过命令清空表中已有的数据,以下命令正确的包括()。A)对非分区表truncatetabletable_name;B)对分区表truncatetabletable_name;C)对分区表altertabletable_namedroppartition;D)对所有表droptabletable_name;答案:AC解析:[多选题]89.阿里云机器学习PAl支持多种常见的算法,以下算法中属于分类算法的有()。A)KNNB)RandomForestC)K-MeansD)DBSCAN答案:AB解析:[多选题]90.KNN是数据挖掘分类技术中最简单的方法之一关于KNN算法的描述,以下哪些是正确的?A)KNN称为K近邻算法B)KNN称为K均值算法C)属于分类算法D)属于聚类算法答案:AC解析:[多选题]91.在MaxCompute中,项目之间有着多重的安全机制。如果项目空间A已经设置了项目保护(ProjectProtection),可以通过())等方式在不破坏目前保护机制的情况下,允许将数据导入到项目空间B。A)将项目空间B设置为项目空间A的可信项目空间B)在打开prolectprotectlon时设置例外策略C)将项目空间B的管理员加入到项目空间AD)使用insertinto的方式。将项目空间A中数据插入到项目空间B中的表里去答案:AB解析:[多选题]92.MaxCompute作为大数据存储、计算的服务,被广泛应用到了企业场景中。以下适合使用MaxCompute的有().A)搜集,分析用户行为数据,为用户细分建模B)构建企业级的数据仓库,对企业历史数据进行加工处理C)保存、处理海量日志数据,并结合机器学习PAIl对日志进行建模分析D)处理企业历史数据,并生成分析结果。提供终端用户进行即席查询E)作为业务办理系统的后台数据存储工具。响应高并发的用户请求答案:ABCE解析:[多选题]93.Tunnel是MaxCompute提供的数据传输服务,提供高并发的离线数据上传下载服务,以下关于Tunnel的说法正确的是?A)支持每天TBP目级别的数据导入导出B)特别适用于增量数据的导入C)特别适合于全量数据或历史数据的批量导入D)Tunnel功能及TunnelSDK支持外部表操作答案:AC解析:[多选题]94.DataWorks可以灵活的设置权限,包括组织管理员,项目管理员,开发,运维,部署以及访客等。其中运维是最常见的角色之一,具有执行等操作的权限。A)创建工作流B)线上运维.C)创建发布包D)执行发布操作答案:BD解析:[多选题]95.DataWorks中,调度任务每次运行前都先将任务实例化,即生成对应的实例,调度运行时实际上在执行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括().A)未运行B)运行中C)运行成功D)暂停答案:ABC解析:[多选题]96.DataWorks项目空间的管理员角色拥有项目空间的各种管理权限,以下操作中()必须由拥有项目管理员角色的成员来完成。A)创建Dataworks项目空间B)把组织成员添加为项目成员并分配合理的角色C)添加调度资源组D)添加数据源答案:AD解析:[多选题]97.DataWorks中可以配置任务调度的时间粒度,目前支持()等时间粒度的调度。A)1分钟B)1天C)1月D)1小时答案:ABCD解析:[多选题]98.DataV按照使用场景主要可以分为三类,分别是展示类大屏、分析类大屏和监控类大屏。以下关于分析类大屏的播术正确的是?A)为运球人员提供监控信息B)展示数据关联及分析结果C)多用于讨论决策D)偏重于展示业务信息结构以及业务亮点答案:ABCD解析:[多选题]99.DataWorks中,如果当前工作流/节点任务存在上游任务,则调度执行时,必须满足()等条件才可以调度执行。A)上游任务已经执行B)上游任务已经执行井返回成功C)自身定制时间已到或已过D)自身定制时间未到答案:BC解析:[多选题]100.目前QuickBl支持40余种数据图表,不同的数据需要不同的图表类型来展示;如果需要查看某一个产品在一定时间范围内的销售或收入趋势,以下哪些图表是最适合的?A)线图B)面积图C)饼圈D)漏斗图答案:AB解析:[多选题]101.大数据(BlgData),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。以下哪些属于大数据的处理思路?A)复除问题简单化B)-个大问题拆分成多个小问题C)复杂问题作为一个整体进行分析D)小问题直接忽略不计答案:AB解析:[多选题]102.在MaxComputesQL中可以通过命令清空表中已有的数据,以下命令正确的包括().A)对非分区表truncatetabletalble_name;B)对分区表truncatetabletable_name;C)对分区表altertabletable_namedroppartition;D)对所有表droptablletable_name;答案:AC解析:[多选题]103.MaxCompute作为大数据存储、计算的服务,被广泛应用到了企业场景中。以下适合使用MaxCompute的有().A)按集,分断用户行为数据。为用户细分建模B)将建企业级的数据仓库,对企业历史数据进行加工处理C)保存、处理海量日去数据。并结合机器学习PAl到日志遗行建模分断D)处理企业历史数猖,并生成分断结里,提供终毓用户进行即席查询E)作为业努办理系统的后台教掘存储工具,响应高井发的用户请求答案:ABCE解析:[多选题]104.Tunnel是MaxCompute提供的数据传输服务,提供高并发的离线数据上传下载服务,以下关于Tunne的说法正确的是?A)支持每天TB/P日级别的数据导入导出B)特别适用于增痘数据的导入C)特剧适合于全图数据或历史数据的批盘导入D)Tunnel场能及TunnelSDK麦持外部表操作答案:AC解析:[多选题]105.DataWorks中,调度任务每次运行前都先将任务实例化,即生成对应的实例,调度运行时实际上在执行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括().A)未运行B)运行中C)运行成功D)暂停答案:ABC解析:[多选题]106.使用DataWorks可以开发、配置数据同步任务,以下说法正确的有().A)国要通过项目管理中的数据源配置添加数据源B)可以拍暖源表部分列,建立字段问的对应关系。不能加入常量或是专量C)对源费据提取可参考where过速语句,作为增翻同步的条件D)可以设置清理规则。写入前清理已有数据残是写入前探留已有数据E)可以使用别统提供的时问资量,包活$currwnt_time}和s4run_time}答案:ABCD解析:[多选题]107.DataWorks的运维中心是日常运维的主要工具,可对已提交工作流或节点任务进行管理与维护,同时也可针对节点来添加监控报警。运维中心可以供多种角色使用,包括().A)开发B)部著C)运维D)项目管理品E)访客答案:ABCDE解析:[多选题]108.Datav按照使用场景主要可以分为三类,分别是展示类大屏、分析类大屏和监控类大屏。以下关于分析类大屏的描述正确的是?A)为运维人员提俱苎控信息B)展示数据关联及分龂结里C)多用于讨论决障D)偏重于展示业务慎息结构以及业务亮点答案:ABCD解析:[多选题]109.DataWorks中可以通过配置报警规则来监控周期调度任务的运行,以便及时告警。目前DataWorks支持―本题分值②的告警方式有().A)邮件B)运信C)电话D)旺旺E)钉钉答案:ABE解析:[多选题]110.创建数据集是QuickBl前端可视化数据分析的基础,用户可以通过哪些方式创建数据集?A)通过上传本地文件创建数据集B)通过教据源表创建教据集C)通过即席分析SQL创建敌据集D)通过已有数据集创建新的数据集答案:BC解析:[多选题]111.在MaxComputeSQL中可以通过命令清空表中已有的数据,以下命令正确的包括().A)对非分区表truncatetabletablename;B)对分区表truncatetabletablename;C)对分区表altertabletable.namedroppartition;D)对所有表droptabletablename;答案:AC解析:[多选题]112.阿里云机器学习PAI支持多种常见的算法,以下算法中属于分类算法的有()。A)KNNB)RandomForestC)K-MeansD)DBSCAN答案:AB解析:[多选题]113.大数据计算服务MaxCompute是阿里云提供的一种完全托管的TB/PB级数据仓库解决方案。下面的产品特点中,正确的有()。A)分布式架构B)高度安全可靠C)多重管理与授权D)高效事务处理E)快速实时响应F)智能索引及多级缓存答案:ABC解析:[多选题]114.QuickBI在阿里云大数据解决方案中扮演了很重要的角色,可以提供包括()等在内的多种功能。A)报表展示B)即席查询C)门户集成D)数据采集答案:ABC解析:[多选题]115.在MaxC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论