人工智能机器学习技术练习(习题卷3)_第1页
人工智能机器学习技术练习(习题卷3)_第2页
人工智能机器学习技术练习(习题卷3)_第3页
人工智能机器学习技术练习(习题卷3)_第4页
人工智能机器学习技术练习(习题卷3)_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能机器学习技术练习人工智能机器学习技术练习(习题卷3)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能机器学习技术练习第1部分:单项选择题,共155题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.关于线性回归算法,说法正确的是()A)在高维空间中求解一个线性方程的系数组合B)对异常值不敏感C)无需对数据做标准化处理答案:A解析:[单选题]2.样本选择的目的是为了()A)统计样本分布B)筛选无意义样本C)监督学习答案:B解析:[单选题]3.对于线性回归,我们应该有以下哪些假设?:A)找到利群点很重要,因为线性回归对利群点很敏感B)线性回归要求所有变量必须符合正态分布C)线性回归假设数据没有多重线性相关性答案:A解析:利群点要着重考虑,第一点是对的不是必须的,当然,如果是正态分布,训练效果会更好有少量的多重线性相关性是可以的,但是我们要尽量避免[单选题]4.分类模型在进行训练时需要()A)训练集B)训练集与测试集C)训练集、验证集、测试集答案:C解析:[单选题]5.基于层次的聚类,说法正确的是()A)凝聚法是从一个大的数据簇开始计算B)分裂法是从一个小的数据簇开始计算C)簇与簇之间可以进行合并,进行层次分析答案:C解析:[单选题]6.随机试验所有可能出现的结果称为()。A)基本事件B)样本C)全部事件D)样本空间答案:D解析:随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点。全体样本点组成的集合,即随机试验的所有可能出现的结果称为这个试验的样本空间。[单选题]7.对于非线性回归问题,以下说法错误的是哪个()。A)可以分别求单个自变量与因变量的回归方程,然后简单求这些方程的加权和B)非线性回归方程的系数需要把其转化为线性回归方程才方便求解C)非线性回归模型的检验也可以使用R2D)Logistic回归是一种典型的广义线性回归模型答案:A解析:[单选题]8.1台机器对200个单词进行排序花了200秒(使用冒泡排序),那么花费800秒,大概可以对多少个单词进行排序A)400B)500C)600D)800答案:A解析:[单选题]9.下列关于线性模型的描述错误的是()。A)支持向量机的判别函数一定属于线性函数B)在样本为某些分布情况时,线性判别函数可以成为最小错误率或最小风险意义下的最优分类器C)在一般情况下,线性分类器只能是次优分类器D)线性分类器简单而且在很多期情况下效果接近最优,所以应用比较广泛答案:A解析:支持向量机的判别函数不一定是线性函数。[单选题]10.对数值型输出,最常见的结合策略是(__)。A)投票法B)平均法C)学习法D)排序法答案:B解析:[单选题]11.以下机器学习中,在数据预处理时,不需要考虑归一化处理的是()A)逻辑回归B)支持向量机C)树形模型D)神经网络答案:C解析:[单选题]12.下列有关人工智能、机器学习、深度学习三者关系的说法正确的是()A)深度学习是实现机器学习的一种方法B)深度学习是实现人工智能的一种技术C)人工智能是实现机器学习的一种方法D)深度学习是实现机器学习的一种技术答案:D解析:[单选题]13.机器学习的实质在于()A)找B)想C)判断D)理解答案:A解析:[单选题]14.下列()不是将主观信息加入到模式发现任务中的方法。A)与同一时期其他数据对比B)可视化C)基于模板的方法D)主观兴趣度量答案:A解析:[单选题]15.关于集成学习算法的说法正确的是()A)一种并行的算法框架B)一种串行的算法框架C)一类全新的数据挖掘算法D)一类将已有算法进行整合的算法答案:D解析:[单选题]16.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是()。A)主分量分析的最佳准则是对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小B)在经主分量分解后,协方差矩阵成为对角矩阵C)主分量分析就是K-L变换D)主分量是通过求协方差矩阵的特征值得到答案:C解析:主分量分析的变换矩阵是协方差矩阵,K-L变换的变换矩阵可以有很多种(二阶矩阵、协方差矩阵、总类内离散度矩阵等)。当K-L变换矩阵为协方差矩阵时,等同于PCA。[单选题]17.多次?采样?,然后求取平均累积奖赏来作为期望积累奖赏的近似,这称为(__)。A)免模型学习B)机器学习C)深度学习D)蒙特卡罗强化学习答案:D解析:[单选题]18.list类型的内置方法pop()的作用是()。A)置顶指定元素B)给元素排序C)删除指定元素D)插入指定元素答案:C解析:[单选题]19.以下不是tuple类型的是()。A)(1)B)(1,)C)([],[1])D)([{?a?:1}],[?b?,1])答案:A解析:[单选题]20.为了观察测试Y与X之间的线性关系,X是连续变量,使用下列哪种图形比较适合?A)散点图B)柱形图C)直方图D)以上都不对答案:A解析:散点图反映了两个变量之间的相互关系,在测试Y与X之间的线性关系时,使用散点图最为直观。[单选题]21.假设有矩阵a,则查看该矩阵有几个维度的是()。A)ndimB)a.sizeC)a.ndim()D)a.size()答案:A解析:[单选题]22.传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么()A)给定标签B)离散C)分类D)回归答案:D解析:[单选题]23.()是指过滤器在图像上滑动的距离。A)卷积核大小B)卷积步长C)过滤器大小D)图像大小答案:B解析:[单选题]24.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?A)探索性数据分析B)建模描述C)预测建模D)寻找模式和规则答案:A解析:[单选题]25.作为分布式消息队列,既有非常优秀的吞吐量,又有较高的可靠性和扩展性,同时接受SparkStreaming的请求,将流量日志按序发送给SparkStreaming集群是()A)FlumeB)ZookeeperC)KafkaD)Sparkstreaming答案:C解析:[单选题]26.(__)不属于相关分析。A)正相关B)负相关C)线性相关D)误差相关答案:D解析:[单选题]27.主成分分析是一种常用的(__)方法。A)降维B)分类C)回归D)聚类答案:A解析:[单选题]28.当不知道数据所带标签时,可以使用()促使带同类标签的数据与带其他标签的数据相分离。A)分类B)聚类C)关联分析D)隐马尔可夫链答案:B解析:聚类是一种典型的无监督学习任务,不要求样本集数据带标签。[单选题]29.电影投资金额和电影收入之间的关系可以用一个一元线性回归方程来表示,下列说法正确的是()。A)投资越多收入越少B)投资越少收入越多C)投资越多收入越多D)投资和收入的关系不确定答案:C解析:[单选题]30.以下哪个不是Python关键字()。A)fromB)assertC)notD)final答案:D解析:[单选题]31.当k=3时,使用k近邻算法判断下图中的绿色方框属于()A)圆形B)三角形C)长方形D)以上都不是答案:B解析:[单选题]32.关于函数的下列说法不正确的是()。A)函数可以没有参数B)函数都有返回值C)函数可以没有return语句D)函数可以有多个返回值答案:B解析:[单选题]33.对于分类任务来说,在所有相关概率都已知的理想情形下,(__)考虑如何基于这些概率和误判损失来选择最优的类别标记。A)支持向量机B)间隔最大化C)线性分类器D)贝叶斯决策论答案:D解析:[单选题]34.()是二维随机变量的分布。A)正态分布B)二项分布C)边缘分布D)指数分布答案:C解析:二维随机变量的分布有边缘分布和条件分布。[单选题]35.线性判别分析常被视为一种经典的__技术。A)非监督降维B)半监督降维C)监督降维D)半监督SVM答案:B解析:[单选题]36.tf.nn.rnn_cell.MultiRNNCell()函数的作用是()。A)生成卷积神经网络B)生成LSTMC)生成池化层D)生成多层RNN网络答案:D解析:[单选题]37.在包含N个文档的语料库中,随机选择的一个文档总共包含T个词条,词条?hello?出现K次。如果词条?hello?出现在全部文档的数量接近三分之一,则TF(词频)和IDF(逆文档频率)的乘积的正确值是多少?A)KT*Log(3)B)T*Log(3)/KC)K*Log(3)/TD)Log(3)/KT答案:C解析:[单选题]38.有关决策树的分类方法正确的是()A)决策树不能确定对决策属性起重要影响的变量B)决策树可以用于发现多种样本的特征C)决策树可用于确定相似的样本D)决策树结构越复杂越有效答案:B解析:[单选题]39.抖动技术可以()A)改善图像的空间分辨率B)改善图像的幅度分辨率C)利用半输出技术实现D)消除虚假轮廓现象答案:D解析:[单选题]40.SVM(支持向量机)为什么会使用替代损失函数(如hinge损失,指数损失等)?A)替代损失函数可以扩大SVM的应用场景B)0/1损失函数非凸、不连续C)替代损失函数可以减少过拟合D)其余选项皆错答案:B解析:直接使用0/1损失函数的话其非凸、非连续,数学性质不好优化起来比较复杂,因此需要使用其他的数学性能较好的函数进行替换,替代损失函数一般有较好的数学性质。常用的三种替代函数:1、hinge损失;2、指数损失;3、对率损失。[单选题]41.以下有关神经网络的说法错误的是()A)MP模型在隐藏层和输出层都对神经元进行激活函数处理B)使用多层功能神经元可以解决非线性可分问题C)神经网络?学?到的东西,蕴含在连接权值和阈值中D)BP算法基于梯度下降策略答案:A解析:[单选题]42.半监督学习包括__。A)纯半监督学习B)主动学习C)回归学习D)分类学习、答案:A解析:[单选题]43.如下属于机器学习应用的包括()A)自动计算,通过编程计算456*457*458*459的值B)文字识别,如通过OCR快速获得的图像中出汉字,保存为文本C)语音输入,通过话筒将讲话内容转成文本D)麦克风阵列,如利用灵云该技术实现远场语音交互的电视答案:A解析:[单选题]44.下列哪个不属于特征的类型A)关键特征B)冗余特征C)相关特征D)无关特征答案:A解析:[单选题]45.k近邻学习是一种(__)。A)监督学习方法B)半监督学习方法C)无监督学习方法D)测试方法答案:A解析:[单选题]46.假定你使用SVM学习数据X,数据X里面有些点存在错误。现在如果你使用一个二次核函数,多项式阶数为2,使用松弛变量C作为超参之一。当你使用较大的C(C趋于无穷),则()。A)仍然能正确分类数据B)不能正确分类C)不确定D)以上均不正确答案:A解析:采用更大的C,误分类点的惩罚就更大,因此决策边界将尽可能完美地分类数据。[单选题]47.()先对数据集进行特征选择,然后再训练学习器。A)过滤式选择B)包裹式选择C)稀疏表示D)嵌入式选择答案:A解析:[单选题]48.在一个简单的线性回归模型中(只有一个变量),如果将输入变量改变一个单位(增加或减少),那么输出将改变多少?A)一个单位B)不变C)截距D)回归模型的尺度因子答案:D解析:很简单,假设线性回归模型是:y=a+bx,若x改变一个单位,例如x+1,则y改变b个单位。b是回归模型的尺度因子。[单选题]49.(__)度量了学习算法的期望预测与真实结果的偏离程度。A)偏差B)方差C)均方差D)泛化误差答案:A解析:[单选题]50.假如使用一个较复杂的回归模型来拟合样本数据,使用Ridge回归,调试正则化参数λ,来降低模型复杂度。若λ较小时,关于偏差(bias)和方差(variance),下列说法正确的是?A)若λ较小时,偏差减小,方差减小B)若λ较小时,偏差减小,方差增大C)若λ较小时,偏差增大,方差减小D)若λ较小时,偏差增大,方差增大答案:B解析:[单选题]51.(__)是将低层次数据转换为高层次数据的过程。A)数据化B)数据整理C)数据加工D)数据整齐化答案:C解析:[单选题]52.可用信息增益来进行决策树的()。A)树高B)叶子结点数C)总结点数D)划分属性选择答案:D解析:[单选题]53.关于ZooKeeper的说法不正确是()A)采用层次化的数据结构B)采用类似于LINUX命令进行数据访问C)具备临时节点和永久节点D)永久节点会随客户端会话的结束而结束其生命周期答案:D解析:[单选题]54.数据集(iris.csv)以鸢尾花的特征作为数据源,包含150个数据,根据鸢尾花4个不同的特征将数据集分为3个品种。下列选项中,()不是这3种之一。A)山鸢尾B)变色鸢尾C)维尔罗卡鸢尾D)维吉尼亚鸢尾答案:C解析:[单选题]55.()不可以直接来对文本分类。A)K-meansB)决策树C)支持向量机D)KNN答案:A解析:K-means是聚类方法,属于无监督学习。BCD都是常见的分类方法。[单选题]56.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?A)根据内容检索B)建模描述C)预测建模D)寻找模式和规则答案:A解析:[单选题]57.关于k-means算法,正确的描述是()A)能找到任意形状的聚类B)初始值不同,最终结果可能不同C)每次迭代的时间复杂度是O(n^2),其中n是样本数量D)不能使用核函数答案:B解析:[单选题]58.混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?A)混沌度没什么影响B)混沌度越低越好C)混沌度越高越好D)混沌度对于结果的影响不一定答案:B解析:[单选题]59.因为文本数据在可用的数据中是非常无结构的,它内部会包含很多不同类型的噪点,所以要做数据预处理。以下不是自然语言数据预处理过程的是:A)词汇规范化B)词汇关系统一化C)对象标准化D)噪声移除答案:B解析:[单选题]60.下列选项不属于机器学习研究内容的是()A)学习机理B)自动控制C)学习方法D)计算机存储系统答案:B解析:[单选题]61.(__)采用图表或数学方法描述数据的统计特征。A)描述统计B)洞见统计C)推断统计D)归纳统计答案:A解析:[单选题]62.()是指机器学习算法对新鲜样本的适应能力。A)模型测试B)泛化能力C)过拟合D)模型训练答案:B解析:[单选题]63.(__)是指同样的一句话,可能有两种或者更多的切分方法。A)生词B)歧义C)断句D)分词答案:B解析:[单选题]64.决策树是基于(__)结构来进行决策的。A)树B)链C)队列D)栈答案:A解析:[单选题]65.下面说法错误的是()A)遗传算法直接以适应度作为搜索信息,无需导数等其他辅助信息B)决策树算法对离散属性和连续属性进行建模C)Hapfield网络不仅有不动点吸引子,也有其它类型的吸引子D)决策树是一种混合算法,它综合了多种不同的创建树的方法答案:B解析:[单选题]66.为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到一个重要的信息处理的机制是()A)专家系统B)人工神经网络C)模式识别D)智能代理答案:B解析:[单选题]67.LARS属于哪种特征选择方法A)包裹式B)启发式C)嵌入式D)过滤式答案:C解析:[单选题]68.一般地,?人?与?马?分别与?人马?相似,但?人?与?马?很不相似;要达到这个目的,可以令?人??马?与?人马?之间的距离都比较小,但?人?与?马?之间的距离很大,此时该距离不满足(__)。A)非负性B)同一性C)对称性D)直递性答案:D解析:[单选题]69.下列选项中属于感知技术的是()A)机器学习技术和计算实施技术B)计算实施技术和语音识别技术C)语音识别技术和机器视觉D)机器视觉和机器学习技术答案:C解析:[单选题]70.下图显示的机器学习使用的激活函数(Activationfunction)的图形,是下列哪一个函数的图形?()A)B)C)D)答案:C解析:[单选题]71.()是指为最小化总体风险,只需在每个样本上选择能使特定条件风险最小的类别标记。A)支持向量机B)间隔最大化C)线性分类器D)贝叶斯判定准则答案:D解析:[单选题]72.标准AdaBoost只适用于____任务A)多分类B)二分类C)回归D)分类答案:A解析:[单选题]73.下列关于半朴素贝叶斯描述错误的为A)假设属性之间完全独立;B)假设属性之间部分相关;C)独依赖估计为半朴素贝叶斯最常用的策略;D)假设所以属性都依赖于同一个属性;答案:A解析:[单选题]74.机器学习中L1正则化和L2正则化的区别是()。A)使用L1可以得到稀疏的权值,使用L2可以得到平滑的权值B)使用L1可以得到平滑的权值,使用L2可以得到平滑的权值C)使用L1可以得到平滑的权值,使用L2可以得到稀疏的权值D)使用L1可以得到稀疏的权值,使用L2可以得到稀疏的权值答案:A解析:使用L1可以得到稀疏的权值,使用L2可以得到平滑的权值。[单选题]75.二分类问题使用__检验。A)二项检验B)t检验C)交叉验证t检验D)McNemar检验答案:D解析:[单选题]76.下列哪个属性是hdfs-site.xml中的配置?A)dfs.replicationB)fs.defaultFSC)D)yarn.resourcemanager.address答案:A解析:[单选题]77.以下关于人工智能的说法中,错误的是A)人工智能是研究世界运行规律的科学B)人工智能涵盖多个学科领域C)人工智能包括自动推理,专家系统,机器学习等技术D)现阶段的人工智能核心是机器学习答案:A解析:[单选题]78.对于图像识别问题(比如识别照片中的猫),()神经网络模型更适合解决这类问题。A)感知机B)循环神经网络C)卷积神经网络D)多层感知机答案:C解析:[单选题]79.以下有关可视化认识错误的是哪个()。A)可视化是简单地把原始的数据用图的形式展示出来的方法B)可视化可以作为数据预处理的一种方法,找出其中的噪声C)可视化本身是一种数据分析方法,使用图表把数据中隐藏的规律展示出来D)通过数据的可视化,可以促进数据分析人员对数据的认识和规律发现答案:A解析:[单选题]80.(__)对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性进行划分。A)AdaBoostB)RFC)BaggingD)传统决策树答案:B解析:[单选题]81.神经网络算法有时会出现过拟合的情况,那么采取以下哪些方法解决过拟合更为可行()。A)为参数选取多组初始值,分别训练,再选取一组作为最优值B)增大学习的步长C)减少训练数据集中数据的数量D)设置一个正则项减小模型的复杂度答案:D解析:[单选题]82.输入图像为32x32,经过步长为1,不进行padding,卷积核为5x5的卷积层后,得到的特征图尺寸是多少?()A)28x28B)27x27C)29x29D)32x32答案:A解析:[单选题]83.(__)用于将非线性引入神经网络。它会将值缩小到较小的范围内。A)损失函数B)优化函数C)激活函数D)目标函数答案:C解析:[单选题]84.一幅灰度级均匀分布的图象,其灰度范围在[0,255],则该图象的信息量为:()A)0B)255C)6D)8答案:D解析:[单选题]85.下列关于支持向量回归说法,错误的是()。A)支持向量回归是将支持向量的方法应用到回归问题中B)支持向量回归同样可以应用核函数求解线性不可分的问题C)同分类算法不同的是,支持向量回归要最小化一个凹函数D)支持向量回归的解是稀疏的答案:C解析:支持向量机最大间隔模型是一个凸二次规划问题。[单选题]86.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?A)第一个B)第二个C)第三个D)第四个答案:B解析:[单选题]87.机器翻译属于下列哪个领域的应用?A)自然语言系统B)机器学习C)专家系统D)人类感官模拟答案:A解析:[单选题]88.在模型评估与度量的方法中,(__)以自助采样法为基础。A)自助法B)留出法C)交叉验证法D)错误率分析答案:A解析:[单选题]89.(__)代表的是生成数据的机构。A)数据资源B)数据源C)数据端D)数据站答案:A解析:[单选题]90.自然语言处理包括语言识别、语音合成和()A)语言翻译B)语言理解C)语言交流D)语言训练答案:B解析:[单选题]91.(__)是根据数据采样来估计概率分布参数的经典方法。A)贝叶斯判定准则B)贝叶斯决策论C)贝叶斯分类器D)极大似然估计答案:D解析:[单选题]92.下列不属于聚类性能度量外部指标的是(__)。A)Jaccard系数B)FM系数C)Rand指数D)DB指数答案:D解析:[单选题]93.在深度优先策略中,open表是()的数据结构A)先进先出B)先进后出C)根据估价函数值重排D)随机出答案:B解析:[单选题]94.如果将均匀噪声的定义范围增加一倍,则其方差?A)不变B)增加为两倍C)增加为四倍D)增加为八倍答案:B解析:[单选题]95.请阅读下面一段程序:ImportnumpyasnpNp.arange(1,10,3)运行程序,最终执行的结果是()。A)array([1,4,7,10])B)array([1,4,7])C)array([2,5,8])D)array([3,6,9])答案:B解析:[单选题]96.以下不是开源工具特点的是A)免费B)可以直接获取源代码C)用户可以修改源代码并不加说明用于自己的软件中D)开源工具一样具有版权答案:C解析:[单选题]97.k近邻算法在()的情况下效果较好。A)样本较多但典型性不好B)样本较少但典型性好C)样本呈团状分布D)样本呈链状分布答案:B解析:k近邻算法主要依靠的是周围的点,因此如果样本过多,则难以区分,典型性好的容易区分。样本都是呈团状分布,KNN就发挥不出其求近邻的优势了,整体样本应该具有典型性好,样本较少,比较适宜。[单选题]98.关于数据清洗,不正确的说法是()A)单数据源,主键取值不能重复B)多数据源会存在数据重复,单位不一致的问题C)连续型数据不存在冗余问题D)缺失值可以采用删除和填补等方法处理答案:C解析:[单选题]99.信息增益对可取值数目()的属性有所偏好,增益率对可取值数目()的属性有所偏好。A)较高,较高B)较高,较低C)较低,较高D)较低,较低答案:B解析:[单选题]100.做卷积运算的缺点是,卷积图像的大小会不断缩小,另外图像的左上角的元素只被一个输出所使用,所以在图像边缘的像素在输出中采用较少,也就意味着你丢掉了很多图像边缘的信息。为了解决这个问题,在卷积过程中引入了()。A)poolingB)paddingC)convolutionD)FC答案:B解析:[单选题]101.当改变图像的空间分辨率时,受影响最大的是图像中的()A)纹理区域(有许多重复单元的区域)B)灰度平滑的区域C)目标边界区域D)灰度渐变区域答案:A解析:[单选题]102.有监督的学习和无监督的学习的根本区别在于()A)学习过程是否需要人工干预B)学习样本是否需要人工标记C)学习结果是否需要人工解释D)学习参数是否需要人工设置答案:B解析:[单选题]103.(__)是一系列为达到某既定目标所需完成的实践,包括对应的工具、方法、资源和人。A)关键过程B)平台与架构C)数据治理D)数据管理策略答案:A解析:[单选题]104.某单位运用随机森林算法思想建立抢修热点模型。该模型主要预测下期台区工单数量,构建抢修热点。模型构建步骤如下:①将历史数据进行随机自助法重抽样,生成N个训练样本集;②将N个训练样本集分别做决策树,生成N棵决策树;③将N棵决策树随机构成随机森林;④未来根据预测样本气候环境、设备属性、设备工况进行随机森林决策投票,得出针对该预测样本最优的决策树进行运算,并计算出最终结果。模型算法构建步骤合理的顺序是()。A)①②③④B)①③②④C)④①②③D)④②①③答案:A解析:[单选题]105.请看如下代码:ImportnumpyasnpArr=np.array([[6,2,7],[3,6,2],[4,3,2]]Arr.sort()Arr对代码中的NumPy数组执行sort()方法结果正确的是()。A)[[267][236]]B)[[267][632]]C)[[762][632]]D)[[762][236]]答案:A解析:[单选题]106.(__)是广义线性模型在g(·)=ln(·)时的特例。A)线性模型B)线性回归C)线性判别分析D)对数线性回归答案:D解析:[单选题]107.下面关于数据科学与机器学习的关系描述不正确的有(__)。A)机器学习为数据科学中充分发挥计算机的自动数据处理能力提供了重要的手段B)机器学习是数据科学的主要理论基础之一C)机器学习为数据科学中扩展人的数据处理能力提供了重要的手段D)机器学习的基础理论包含数据科学答案:D解析:[单选题]108.对数几率回归(logisticsregression)和一般回归分析有什么区别?:A)对数几率回归是设计用来预测事件可能性的B)对数几率回归可以用来度量模型拟合程度C)对数几率回归可以用来估计回归系数D)以上所有答案:D解析:[单选题]109.在猫狗图像分类任务中,如果100个样本,其中50张猫,50张狗,但图像混在一起,无法区分他们是猫是狗,也就是每个图像无对应的类别标签。如果将这100张样本作为训练集,使用机器学习算法训练学习如何分类猫和狗,此时的训练方法是A)无监督学习B)半监督学习C)监督学习D)混合学习答案:A解析:[单选题]110.后剪枝是先从训练集生成一颗完整的决策树,然后()对非叶结点进行考察。A)自上而下B)在划分前C)禁止分支展开D)自底向上答案:D解析:[单选题]111.在构建一个基于决策树模型时,使用信息增益informationgain作为决策树节点属性选择的标准,以下图片中哪一个属性具信息增益最大:A)OutlookB)HumidityC)WindyD)Temperature答案:A解析:信息增益是划分前样本数据集的不纯程度(熵)和划分后数据集的不纯程度(熵)的差值,计算各信息增益即可。[单选题]112.下列算法中属于局部处理的是:()A)灰度线性变换B)二值化C)傅立叶变换D)中值滤波答案:D解析:[单选题]113.决策树中,同一路径上的所有属性之间是()关系。A)因果B)相关C)逻辑或D)逻辑与答案:D解析:[单选题]114.下列直接影响传统机器学习算法成败的关键因素是哪个A)预处理B)后处理C)训练方法D)特征提取答案:D解析:[单选题]115.下列关于F1值的计算正确的是(__)。A)F1值=正确率*召回率*/(正确率+召回率)B)F1值=正确率*召回率*2/(正确率+召回率)C)F1值=正确率*2/(正确率+召回率)D)F1值=召回率*2/(正确率+召回率)答案:B解析:[单选题]116.下图中判断未知绿圆的类别,体现了哪个机器学习算法的思想?()A)决策树B)贝叶斯分类器C)支持向量机D)K近邻算法答案:D解析:[单选题]117.下面关于?领域务实知识?相关描述不正确的有(__)。A)?领域务实知识?是对数据科学家的特殊要求B)领域务实知识具有显著的面向领域性C)领域务实知识是数据科学的理论基础D)在组建团队时,不需重视领域专家的参与答案:D解析:[单选题]118.多层前馈神经网络描述错误的是A)输出层与输入层之间包含隐含层,且隐含层和输出层都拥有激活函数的神经元;B)神经元之间存在这同层连接以及跨层连接;C)输入层仅仅是接收输入,不进行函数处理;D)每层神经元上一层与下一层全互连;答案:B解析:[单选题]119.在以下不同的场景中,使用的分析方法不正确的有()A)根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级B)根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式C)用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫D)根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女答案:B解析:[单选题]120.下面对范数规则化描述错误的是(__)。A)L0是指向量中0的元素的个数B)L1范数是指向量中各个元素绝对值之和C)L2范数向量元素绝对值的平方和再开平方D)L0是指向量中非0的元素的个数答案:A解析:[单选题]121.避免直接的复杂非线性变换,采用线性手段实现非线性学习的方法是()A)核函数方法B)集成学习C)线性鉴别分析D)Logistic回归答案:A解析:[单选题]122.下列关于LARS算法的说法正确的是A)每次选择一个与残差相关性最大的特征B)是一种包裹式特征选择法C)基于线性回归平绝对误差最小化D)是通过对LASSO稍加修改而实现答案:A解析:[单选题]123.下列关于ndarray对象描述正确的是()。A)ndarray对象中可以存储不同类型的元素B)ndarray对象中存储元素的类型必须是相同的C)ndarray对象不支持广播操作D)ndarray对象不具备矢量运算能力答案:B解析:根据ndarry的特点可知,该对象中元素的类型必须是相同的[单选题]124.关于ndarray对象属性,下列描述错误的是()。A)ndim属性表示数组轴的个数B)shape属性表示每个维度上数组的大小C)size属性表示数组元素的总个数,等于shape属性元组元素的和D)dtype属性表示数组中元素类型的对象答案:C解析:size属性表示数组元素的总个数,等于shape属性元组元素的乘积[单选题]125.()算法的训练数据集部分有特征有标签,部分有特征无标签A)有监督学习B)半监督学习C)无监督学习D)强化学习答案:B解析:[单选题]126.Zookeeper-Stat结构体中dataLength是()A)znode数据变化号B)znode访问控制列表的变化号C)znode子节点数量D)znode的数据长度答案:D解析:[单选题]127.常用的本地文件格式不包括()A)TXT文件B)Excel文件C)CSV文件D)DOT文件答案:D解析:[单选题]128.数据产品开发的关键技术是(__)。A)数据加工B)数据柔术C)数据艺术D)设计思维答案:B解析:[单选题]129.下面哪项操作能实现跟神经网络中Dropout的类似效果A)BoostingB)BaggingC)StackingD)Mapping答案:B解析:Dropout可以认为是一种极端的Bagging,每一个模型都在单独的数据上训练,同时,通过和其他模型对应参数的共享,从而实现模型参数的高度正则化。[单选题]130.以下描述不正确的是()。A)信息是客观的存在B)数据等于数值C)显性知识能够清晰的表述和有效的转移D)智慧是人类超出知识的那一部分能力答案:B解析:[单选题]131.贝叶斯网结构有效地表达了属性的(__)。A)相互制约性B)条件独立性C)取值D)含义答案:B解析:[单选题]132.关于列表数据结构,下面描述正确的是()。A)可以不按顺序查找元素B)必须按顺序插入元素C)不支持in运算符D)所有元素类型必须相同答案:A解析:[单选题]133.下面关于SIFT特征描述错误的是()?A)具有尺度不变性B)具有旋转不变性C)检查的是图像中的极大极小值D)受光照变化影响大答案:D解析:[单选题]134.模型评估的常用方法有哪些A)留出法B)交叉验证法C)自助法D)以上都是答案:D解析:[单选题]135.LSTM中门的输出是()之间的实数向量。A)0到1B)1到-1C)0到-1D)1到2答案:A解析:[单选题]136.已知均值和方差,下面哪种分布的熵最大()A)几何分布B)指数分布C)高斯分布D)均匀分布答案:C解析:[单选题]137.在构造决策树时,以下哪种不是选择属性的度量的方法A)信息值B)信息增益C)信息增益率D)基尼指数答案:A解析:[单选题]138.以下说法正确的是()A)增加模型复杂度,模型在测试集上的准确率就能更好B)L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑C)对于PCA,我们应该选择是的模型具有最小variance的主成分D)每次使用K-means算法得到的聚类结果可能会不一样答案:D解析:[单选题]139.主成分分析方法是一种什么方法()A)分类方法B)回归方法C)降维方法D)参数估计方法答案:C解析:[单选题]140.对以往数据分析结果表明,当机器调整得良好时,产品的合格率为98%,而当机器发生某种故障时,产品的合格率为55%。每天早上机器开动时,机器调整得良好的概率为95%。计算已知某日早上第一件产品是合格时,机器调整得良好的概率是多少A)0.94B)0.95C)0.96D)0.97答案:D解析:[单选题]141.下面哪种学习方式引入了额外的专家知识,通过与外界的交互来将部分未标记样本转变为有标记样本(__)。A)纯半监督学习B)半监督学习C)直推学习D)主动学习答案:D解析:[单选题]142.训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM?A)大数据集B)小数据集C)中等大小数据集D)和数据集大小无关答案:A解析:有明确分类边界的数据集最适合SVM[单选题]143.以下哪种方法不能防止过拟合?A)交叉验证B)低维嵌入C)剪枝D)集成学习答案:B解析:1、交叉检验,通过交叉检验得到较优的模型参数;2、特征选择,减少特征数或使用较少的特征组合,对于按区间离散化的特征,增大划分的区间。3、正则化,常用的有L_1、L_2正则。而且L_1正则还可以自动进行特征选择。4、如果有正则项则可以考虑增大正则项参数lambda.5、增加训练数据可以有限的避免过拟合。6、Bagging,将多个弱学习器Bagging一下效果会好很多,比如随机森林等。[单选题]144.机器通过人类发现的问题空间的数据,进行机器学习,具有在人类发现的问题空间中求解的能力,并且求解的过程与结果可以被人类智能(),此为机器智能的产生A)理解B)参考C)相同D)采纳答案:A解析:[单选题]145.OLAM技术一般简称为?数据联机分析挖掘?,下面说法正确的是:A)OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性;B)由于OLAM的立方体和用于OLAP的立方体有本质的区别.C)基于WEB的OLAM是WEB技术与OLAM技术的结合.D)OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作.答案:D解析:[单选题]146.以下表的设计,最合理的是A)学生{id,name,age},学科{id,name}分数{学生id,学科id,分数}B)学生{id,name,age},分数{学生id,学科id,学科name,分数}C)分数{学生id,学生name,学生age,学科id,学科名称,分数,}D)学科{id,name},分数{学生id,学生姓名,学生age,学科id,分数}答案:A解析:[单选题]147.以下哪种情况LDA会失败?A)如果有辨识性的信息不是平均值,而是数据的方差B)如果有辨识性的信息是平均值,而不是数据方差C)如果有辨识性的信息是数据的均值和方差D)都不是答案:A解析:LDA算法既可以用来降维,又可以用来分类,但是目前来说,主要还是用于降维。在我们进行图像识别图像识别相关的数据分析时,LDA是一个有力的工具。下面总结下LDA算法的优缺点。LDA算法的主要优点有:1)在降维过程中可以使用类别的先验知识经验,而像PCA这样的无监督学习则无法使用类别先验知识。2)LDA在样本分类信息依赖均值而不是方差的时候,比PCA之类的算法较优。LDA算法的主要缺点有:1)LDA不适合对非高斯分布样本进行降维,PCA也有这个问题。2)LDA降维最多降到类别数k-1的维数,如果我们降维的维度大于k-1,则不能使用LDA。当然目前有一些LDA的进化版算法可以绕过这个问题。3)LDA在样本分类信息依赖方差而不是均值的时候,降维效果不好。4)LDA可能过度拟合数据。LDA用于降维,和PCA有很多相同,也有很多不同的地方,因此值得好好的比较一下两者的降维异同点。首先我们看看相同点:1)两者均可以对数据进行降维。2)两者在降维时均使用了矩阵特征分解的思想。3)两者都假设数据符合高斯分布。我们接着看看不同点:1)LDA是有监督的降维方法,而PCA是无监督的降维方法2)LDA降维最多降到类别数k-1的维数,而PCA没有这个限制。3)LDA除了可以用于降维,还可以用于分类。4)LDA选择分类性能最好的投影方向,而PCA选择样本点投影具有最大方差的方向。[单选题]148.(__)的目的是为给定学习器选择最有利于其性能、?量身定做?的特征子集。A)过滤式选择B)包裹式选择C)嵌入式选择D)正则化答案:B解析:[单选题]149.下面关于增强学习描述不正确的是(__)。A)增强学习主要研究如何协助自治Agent的学习活动B)增强学习基本思路是当Agent在环境中做出每个动作时,施教者会提供奖赏或者惩罚信息,以表示结果状态的正确与否C)增强学习中的Agent需要具备环境交互能力和自治能力D)基于马尔可夫决策不属于增强学习答案:D解析:[单选题]150.对档案内容进行主题分析并将表达这种主题的自然语言转换成档案信息处理语言,使之成为()的过程叫?标引?A)文摘B)检索标识C)目录D)索引答案:B解析:[单选题]151.常用的聚合函数不包括()A)max()B)count()C)sum()D)sex()答案:D解析:[单选题]152.()是一门以可视交互为基础,综合运用图形学、数据挖掘和人机交互等技术等多个学科领域的知识,以实现人机协同完成可视化任务为主要目的分析推理性学科。A)科学可视化B)可视分析学C)数据可视化D)信息可视化答案:B解析:[单选题]153.关于梯度下降算法,以下说法中不正确是:A)在训练集非常大时,批量梯度下降算法会运行得极慢;随机梯度下降和小批量梯度下降可以解决该问题B)随机梯度下降运行速度快,内存开销很小,可以支持使用海量数据集进行训练C)当损失函数很不规则时(存在多个局部最小值)时,相对批量梯度下降算法,随机梯度下降算法更有可能跳过局部最小值,最终接近全局最小值D)梯度下降算法一定能收敛于全局最小值答案:D解析:[单选题]154.编译程序是一种A)翻译程序B)目标程序C)汇编程序D)解释程序答案:A解析:[单选题]155.假设我们在支持向量机(SVM)算法中对Gamma(RBF核系数γ)的不同值进行可视化。由于某种原因,我们忘记了标记伽马值的可视化。令g1、g2、g3分别对应着下面的图1、图2和图3。则关于g1、g2、g3大小下列说法正确的是?放不进图A)g1>g2>g3B)g1=g2=g3C)g1<g2<g3D)g1>g2=g3E)g1<g2=g3答案:C解析:第2部分:多项选择题,共49题,每题至少两个正确答案,多选或少选均不得分。[多选题]156.数据治理包括哪些类型A)应对型治理B)主动型治理C)被动型治理D)安全型治理答案:AB解析:[多选题]157.在机器学习中,下列关于各算法对应的损失函数正确的是()A)最小二乘-SquarelossB)SVM-HingeLossC)LogisticRegression-交叉熵损失函数D)AdaBoost-指数损失函数答案:ABCD解析:[多选题]158.下列关于包裹式选择的描述正确的是(__)。A)包裹式特征选择方法直接针对给定学习器进行优化B)从最终学习器性能来看,包裹式特征选择比过滤式特征选择更好C)包裹式特征选择的计算开销通常比过滤式特征选择大得多D)包裹式特征选择的典型算法:LVW算法,其特征子集搜索采用了随机策略答案:ABCD解析:[多选题]159.Feigenbaum等人在著名的《人工智能手册》中将机器学习划分为机械学习和(_)四种。A)深度学习B)示教学习C)类比学习D)归纳学习答案:BCD解析:[多选题]160.训练CNN时,GPU显存溢出,此时可以采取什么办法?()A)减少mini_batch大小B)移除一些卷积层C)减少图片输入大小D)增加激活函数答案:ABC解析:[多选题]161.(__)是?黑客精神和技能?。A)大胆创新B)喜欢挑战C)追求完美D)不断改进答案:ABCD解析:[多选题]162.在hive中下列哪些命令可以实现去重()A)distinctB)groupbyC)row_numberD)Having答案:ABC解析:[多选题]163.KNN的关键参数是()A)K值B)距离计算方式C)样本总量D)样本均衡性答案:ABD解析:[多选题]164.实现人工神经元的方法有(__)。A)感知器B)线性单元C)SIGMOD单元D)决策单元答案:ABC解析:[多选题]165.下列关于spark中的RDD描述正确的有()A)RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象B)Resilient:表示弹性的,弹性表示C)Destributed:分布式,可以并行在集群计算D)Dataset:就是一个集合,用于存放数据的答案:ABCD解析:[多选题]166.关于卷积神经网络以下说法正确的是()A)常见池化层有最大池化与平均池化B)卷积核不可以用来提取图片全局特性C)处理图片时,是以扫描窗口的方式对图像做卷积D)卷积神经网络可以包含卷积层,池化层和全连接层答案:ACD解析:[多选题]167.KNN的主要优点是()A)理论成熟,思想简单,既可以用来做分类也可以用来做回归B)训练时间复杂度比支持向量机之类的算法低,仅为O(n)C)与朴素贝叶斯之类的算法比,对数据没有假设,准确度高,对异常点不敏感D)可用于非线性分类答案:ABCD解析:[多选题]168.Spark可以采用几种不同的部署方式A)SparkonYARNB)SparkonMesosC)onyarn模式D)Standalone答案:ABD解析:[多选题]169.在机器学习中,下列关于各算法对应的损失函数正确的是()A)最小二乘-SquarelossB)SVM-HingeLossC)LogisticRegression-(log-Loss)D)AdaBoost-指数损失函数答案:ABCD解析:[多选题]170.下列属于聚类性能度量内部指标的是(__)。A)DB指数B)Dunn指数C)Jaccard系数D)FM系数答案:AB解析:[多选题]171.ID3算法从功能上看有哪两点明显不足?A)实例各特征的取值必须是离散值,而不能是连续实数值B)预测目标值只能为离散值,不能是连续实数值,因此只能处理分类问题,不能处理回归问题C)实例各特征的取值必须是连续实数值,而不能是离散值D)预测目标值只能为连续实数值,不能是离散值,因此只能处理回归问题,不能处理分类问题答案:AB解析:[多选题]172.卷积神经网络可以用于()。A)图像分类B)目标提取C)图像分割D)中文分词答案:ABC解析:[多选题]173.数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析及()等方面。A)关联分析B)分类和预测C)聚类分析D)偏差分析答案:ABCD解析:[多选题]174.图像间的算术运算?A)可以?原地完成?是因为每次运算只涉及1个空间位置;B)加法运算和减法运算互为逆运算,所以用加法运算实现的功能也可用减法运算实现;C)与逻辑运算类似,也可用于二值图像;D)与逻辑运算类似,既可对一副图像进行,也可以对两幅图像进行;答案:AC解析:[多选题]175.当闵可夫斯基距离公式中的系数p值为1时,可得到(__)的公式。A)欧氏距离B)曼哈顿距离C)街区距离D)切比雪夫距离答案:BC解析:[多选题]176.数据挖掘的挖掘方法包括()。A)聚类B)回归分析C)神经网络D)决策树算法答案:ABCD解析:利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等。分类方法有决策树算法、KNN算法(K-NearestNeighbor))、SVM算法、VSM算法、Bayes算法、神经网络等。聚类算法有基于密度、基于层次、基于模型、基于网格等。关联规则算法有Apriori算法、FP-Growth算法。[多选题]177.SVM常用的核函数有()A)h次多项式核函数B)高斯径向基函数核函数C)Sigmoid型核函数D)拉普拉斯核函数答案:ABCD解析:[多选题]178.SparkRI的依赖机制包括()A)宽依赖B)深度依赖C)广度依赖D)窄依赖答案:AD解析:[多选题]179.下列模型属于机器学习生成式模型的是()A)朴素贝叶斯B)隐马尔科夫模型(HMM)C)马尔科夫随机场(MarkovRandomFields)D)深度信念网络(DBN)答案:ABCD解析:[多选题]180.可作为决策树选择划分属性的参数是()A)信息增益B)增益率C)基尼指数D)密度函数答案:ABC解析:特征选择的准则主要有信息增益,信息增益率,基尼指数三种。[多选题]181.如将A、B、C三个分类器的PR曲线画在一个图中,其中A、B的PR曲线可以完全包含住C的PR曲线,A与B的PR曲线有交点,A、B、C的平衡点分别为0.79、0.66、0.58,以下说法中正确的是()。A)学习器A的性能优于学习器CB)学习器A的性能优于学习器BC)学习器B的性能优于学习器CD)学习器C的性能优于学习器B答案:ABC解析:若一个学习器的PR曲线被另一个学习器的曲线完全包住,则可断言后者的性能优于前者,如果两个学习器的PR曲线发生了交叉,则可用平衡点度量。[多选题]182.泛化误差可分解为__之和。A)方差B)偏差C)协方差D)噪声答案:ABD解析:[多选题]183.以下属于数据科学的研究目的的是()。A)数据洞见B)数据生态系统建设C)数据业务化D)数据产品的研发答案:ABCD解析:[多选题]184.F1参数由(__)和(__)综合获得A)查全率B)查准率C)误差D)精度答案:AB解析:[多选题]185.以下哪些模型是分类模型:()A)KNNB)KmeansC)NaïveBayesianD)LogisticRegression答案:ACD解析:[多选题]186.信息增益即数据集的熵与在特征条件下的条件熵之差。关于信息增益,正确的说法是A)信息增益越小,具有更强的分类能力,作为确定切分特征的依据。B)信息增益越大,说明条件克服的不确定性越大,具有更强的分类能力。C)计算每个特征的信息增益,选择信息增益最大的特征作为切分特征。D)选择切分特征时,我们可以以信息增益作为指标。答案:BCD解析:[多选题]187.类别不平衡就是指分类问题中不同类别的训练样本相差悬殊的情况,例如正例有900个,而反例只有100个,这个时候我们就需要进行相应的处理来平衡这个问题,下列方法正确的是()A)在训练样本较多的类别中进行欠采样B)在训练样本较多的类别中进行过采样C)直接基于原数据集进行学习,对预测值进行再缩放处理D)通过对反例中的数据进行插值,来产生额外的反例答案:ACD解析:[多选题]188.以下可行的最近邻分类的加速方案()A)分层搜索B)训练样本缩减C)样本增加D)非线性投影答案:AB解析:[多选题]189.下列说法正确的是A)kNN算法的预测效率与训练集的数量有关B)kNN算法只能用于二分类C)kNN算法只能用于回归D)kNN算法属于监督学习答案:AD解析:[多选题]190.(___)是数据集的一般特性。A)特征B)维度C)稀疏性D)分辨率答案:BCD解析:[多选题]191.随机森林中进行投票时,采用()A)平等投票B)权重投票C)随机投票D)不投票答案:AB解析:[多选题]192.支持向量机中定义的间隔值为w的二范式的-2次方,这样看间隔貌似仅与权重w有关,这意味着偏置项b(__)。A)没有任何意义B)对间隔不会产生影响C)通过约束隐式地影响着w的取值D)对间隔会产生影响答案:CD解析:[多选题]193.隐马尔可夫模型三个基本问题以及相应的算法说法正确的是()A)评估-前向后向算法B)解码-维特比算法C)学习-Baum-Welch算法D)学习-前向后向算法答案:ABC解析:[多选题]194.贝叶斯网的求解优化方法为A)贪心算法;B)网络结构施加约束条件;C)最陡梯度下降;D)线性回归;答案:AB解析:[多选题]195.数据科学的基本流程包含(__)。A)数据可视化B)数据加工C)数据化D)数据洞见答案:BCD解析:[多选题]196.下列属于监督学习的有()。A)聚类B)分类C)回归D)降维答案:BC解析:[多选题]197.关于神经网络中局部极小和全局最小描述正确的是A)局部极小解是参数空间中某个点,其领域点的误差函数值均大于该点的函数值;B)全局最小解是指参数空间中所有点的误差函数值均大于该点的函数值;C)局部极小值可能会有多个点,而全局最小值只有一个点;D)全局最小一定是局部极小;答案:ABCD解析:[多选题]198.下列属于原型聚类算法的是(__)。A)k均值算法B)学习向量量化C)高斯混合聚类密度聚类D)密度聚类答案:ABC解析:[多选题]199.关于决策树的CART分类树构造算法和ID3算法,下列说法正确的是?A)选择切分特征时,ID3算法使用基尼指数B)选择切分特征时,CART算法使用信息熵C)选择切分特征时,CART算法使用基尼指数来度量一个数据集的混乱程度D)选择切分特征时,ID3算法使用信息熵答案:CD解析:[多选题]200.以下对数据描述正确的是()。A)数据是现实世界的记录B)数据是人类社会赖以生存的和发展的三大资源之一C)数据分为显性数据和隐性数据D)数据是对信息进行计量和记录而产生的记录答案:AD解析:[多选题]201.以下描述正确的是(__)。A)对重复数据通常采用条件过滤方法B)对无关数据通常采用重复过滤方法C)噪声是指测量变量过程中的随机错误或误差D)数据清洗是指在数据审计活动基础上,将脏数据清洗成干净数据的过程答案:CD解析:[多选题]202.下列哪些假设是我们推导线性回归参数时遵循的?()A)X与Y有线性关系(多项式关系)B)模型误差在统计学上是独立的C)误差一般服从0均值和固定标准差的正态分布D)X是非随机且测量没有误差的答案:ABCD解析:在进行线性回归推导和分析时,我们已经默认上述四个条件是成立的。[多选题]203.决策树的划分选择有()。A)增益系数B)信息增益C)增益率件D)基尼系数E)信息增益量答案:BCD解析:[多选题]204.在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()A)将负样本重复10次,B)直接进行分类,可以最大限度利用数据C)从10w正样本中随机抽取1w参与分类D)将负样本每个权重设置为10,正样本权重为1,参与训练过程E)随机森林F)逻辑回归G)SVMH)决策树答案:AD解析:第3部分:判断题,共33题,请判断题目是否正确。[判断题]205.深度学习是一种利用复杂结构的多个处理层来实现对数据进行高层次抽象的算法A)正确B)错误答案:对解析:[判断题]206.在箱形图中超出上界和下界的值称为异常值。A)正确B)错误答案:对解析:[判断题]207.机器学习中所谓的学习,其本质就是找到特征与标签间的关系(mapping,即映射)A)正确B)错误答案:对解析:[判断题]208.机器学习和深度学习是人工智能的两个不同的分支,很多问题机器学习无法解决,所以诞生了深度学习A)正确B)错误答案:错解析:[判断题]209.join()方法可以使用左连接和右连接两种方式连接数据。A)正确B)错误答案:对解析:[判断题]210.当损失函数很不规则时(存在多个局部最小值)时,相对批量梯度下降算法,随机梯度下降算法更有可能跳过局部最小值,最终接近全局最小值A)正确B)错误答案:对解析:[判断题]211.Anconda不支持Python2.x版本。A)正确B)错误答案:对解析:Anconda支持Python2.6、2.7、3.4、3.5等版本,并可以自由切换[判断题]212.有时会由于包含少量特异点使得数据集变得线性不可分。如果将特异点去掉,剩余数据子集依然是线性可分的。对于这样的数据集,适合采用软间隔线性支持向量机A)正确B)错误答案:对解析:[判断题]213.线性回归模型只能处理具有线性关系的数据。A)正确B)错误答案:错解析:[判断题]214.机器学习的学习方式是通过获得经验或历史数据不断改进提高做某项任务的表现。A)正确B)错误答案:对解析:[判断题]215.训练一个支持向量机,除去不支持的向量后仍能分类。A)正确B)错误答案:对解析:只有支持向量会影响边界[判断题]216.ndarray对象中存储元素的类型必须是相同的。A)正确B)错误答案:对解析:[判断题]217.BP算法的正向传播是为获取训练误差。A)正确B)错误答案:对解析:[判断题]218.K-Means算法基于距离来度量实例间的相似程度,通过对无标记样本的学习来揭示蕴含于数据中的性质及规律A)正确B)错误答案:对解析:[判断题]219.KNN算法的基本思路是近朱者赤,近墨者黑A)正确B)错误答案:对解析:[判断题]220.Pandas中可以通过行索引或行索引位置的切片形式选取行数据。A)正确B)错误答案:对解析:[判断题]221.正则化是为了防止模型过拟合而引入额外信息,对模型原有逻辑进行外部干预和修正,从而提高模型的泛化能力。A)正确B)错误答案:对解析:[判断题]222.NumPy的random模块比Python的random模块功能更多。A)正确B)错误答案:对解析:[判断题]223.寻找最优超参数费时费力,应该在模型训练之前就指定最优参数。A)正确B)错误答案:错解析:[判断题]224.小批量梯度下降同时具备批量梯度下降和随机梯度下降二者的优缺点A)正确B)错误答案:对解析:[判断题]225.线性回归是指通过对训练样本的学习,得到从样本特征到样本标签直接的映射A)正确B)错误答案:对解析:[判断题]226.监督学习是从标记的训练数据来推断一个功能的机器学习任务A)正确B)错误答案:对解析:[判断题]227.传统的机器学习方法的表现主要算法,目前的机器学习主要是强化学习,具有自学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论