人工智能自然语言技术练习(习题卷11)_第1页
人工智能自然语言技术练习(习题卷11)_第2页
人工智能自然语言技术练习(习题卷11)_第3页
人工智能自然语言技术练习(习题卷11)_第4页
人工智能自然语言技术练习(习题卷11)_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷11)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.下列不属于文本分词算法种类的有()。A)基于词典的分词B)基于语料库的分词C)基于统计的分词D)基于规则的分词答案:B解析:[单选题]2.怎样解决梯度爆炸A)对于RNN,可以通过梯度截断,避免梯度消失B)可以通过添加正则项,避免梯度爆炸C)使用LSTM等自循环和门控制机制,避免梯度爆炸D)优化激活函数,譬如将sigmold改为relu,避免梯度消失答案:B解析:[单选题]3.下列选项中,关于激活函数的描述,说法正确的是哪个?A)神经网络中最好的激活函数是sigmoidB)激活函数有正则化作用C)dropout是CNN中的激活函数D)神经元输出后需要给定一个激活函数答案:D解析:[单选题]4.下面哪种不属于数据预处理的方法?A)A:变量代换B)B:离散化C)C:聚集D)D:估计遗漏值答案:D解析:[单选题]5.关于在训练模型,选择超参数的过程中的随机取值指的是?A)随机选择标尺取值B)随机取值就是有效范围内随机均匀取值C)选择合适的标尺进行取值D)随机的进行均匀的取值答案:C解析:[单选题]6.熵表示的是什么A)自变量和因变量之间的关系B)表示数据的多少C)表示数据中心包含信息量的大小D)不确定答案:C解析:[单选题]7.tf.reshape()的用途是?A)相乘B)相加C)维度转化D)相减答案:C解析:[单选题]8.交叉熵函数是常用的损失函数,它是通过度量两个什么分布的差异性A)概率B)矢量C)矩阵信息D)空间答案:A解析:[单选题]9.实际工程问题中,需要根据业务和需求,构建相应的()?A)架构B)数学模型C)流程图D)数据集答案:B解析:[单选题]10.自然语言处理作为人工智能领域最重要的一个研究方向,其技术发展与人工智能的发展历史一样,主要有以下两类方法,其中第一类是基于规则的方法,另一类是()A)基于统计的方法B)基于深度学习的方法C)基于字典的方法D)基于Chomsky语言学的方法答案:A解析:[单选题]11.通过样本数目的累积,使总方差估计值达到所需的精度,该抽样方式是()A)有放回的简单随机抽样B)无放回的简单随机抽样C)分层抽样D)渐进抽样答案:D解析:[单选题]12.下列不属于AdaBoost算法的特点的是()A)每次迭代改变的是样本的分布(Reweight),而不是重复采样。B)样本分布的改变取决于样本是否被正确分类:总是分类正确的样本权值低,总是分类错误的样本权值高(通常是边界附近的样本)。C)最终的结果是弱分类器的加权组合,权值表示该弱分类器的性能。D)每次迭代重复采样答案:D解析:[单选题]13.欠拟合是不好的现象,那么它有什么不好的影响A)在训练集上的效果很好,但是在测试集上的效果很差B)在训练集上的效果差,在测试集上的效果也差C)在训练集上的效果很好,在测试集上的效果也很好D)在训练集上的效果很差,但是在测试集上的效果很好答案:B解析:[单选题]14.KNN算法的分类原理是什么A)利用自变量和因变量之间的一次函数关系B)需要分类的样本选择特征空间上和自己最邻近的K个样本_x0001_把已经分类或需要分类的样本在定义的特征空间上表征需要分类的样本的类别就是这K个样本中最多的那个类别C)利用自变量和因变量之间的对数关系D)找出最好的分类超平面答案:B解析:[单选题]15.使用以下哪种方式编码的词向量包含语义信息A)one-hotB)bagofwordsC)word2vecD)TF-IDF答案:C解析:[单选题]16.sigmoid作为经典的激活函数,经过sigmoid函数的输出值会被压缩到多大?A)[0,1]B)[0,2]C)[0,3]D)[-1,1]答案:A解析:[单选题]17.在使用tf时,其中有很多的接口,例如multiply,这个接口实现的功能是?A)相与B)相乘C)相除D)相加答案:B解析:[单选题]18.命名实体识别中BI-LSTM的作用是什么A)从前向后,单向提取特征B)从后向前,单向提取特征C)从前向后,从后向前,双向提取特征D)不确定答案:C解析:[单选题]19.在岭回归模型中,回归系数的先验分布是()。A)拉普拉斯分布B)正态分布C)正态分布与拉普拉斯的混合分布D)指数分布答案:B解析:[单选题]20.GB18030采用()字节变长编码方式。A)一二三B)一二四C)一三四D)二三四答案:B解析:[单选题]21.()主要是进行分词以及词性标注,为语言模型构建和发音字典创建做准备。A)词语标注B)文本标注C)语音标注D)音素标注答案:B解析:[单选题]22.对于选择超参数,选择了不同的取值,不可以_____?A)选择对训练集目标而言的最优解B)对于开发集而言的最优解C)超参搜索过程中最想优化的东西D)简化参数调试答案:D解析:[单选题]23.现在常用的文本生成是什么样的模型A)只依赖于编码的模型如:bertB)不确定C)基于编解码的端到端的模型seq2seqD)只依赖于解码的模型答案:C解析:[单选题]24.如果文法中的每一条产生式α→β都满足|α|<=|β|,即规则左部的符号个数少于或等于规则右部的符号个数(例如,xYz→xyz),这种文法就称为A)0型文法B)1型文法C)2型文法D)左线性文法答案:B解析:[单选题]25.用哪种数据挖掘方法可以分析出客户对产品的情感倾向()A)关联规则挖掘B)Web文本挖掘C)分类模式挖掘D)序列模式挖掘答案:B解析:[单选题]26.智能问答方法依托的关键基础及技术中哪一项是知识问答系统的大脑()A)知识图谱B)NLPC)深度学习D)信息检索答案:A解析:[单选题]27.循环神经网络RNN的作用描述正确的是A)增大文本数量B)简化文本C)特征提取D)文本分类答案:C解析:[单选题]28.用于寻找出某个能够达到给定目标的动作序列或步骤的专家系统是()A)设计专家系统B)诊断专家系统C)预测专家系统D)规划专家系统答案:D解析:[单选题]29.在图像的人脸识别中,深度学习有哪些应用,使用到的是哪个网络结构A)LeNET5B)(CNN:AlexNet)C)VGGD)ResNet答案:B解析:[单选题]30.关于五元组模型隐马尔科夫说法不正确的是__?A)当前时刻的状态只受上一时刻的影响B)当前时刻的隐藏状态只与当前时刻的观测状态有关C)当前时刻的隐藏状态与上一时刻时刻的观测状态有关D)X表示观测序列,Y表示隐藏状态答案:C解析:[单选题]31.计算图模型是哪个框架中存在的A)pytorchB)tensorflowC)caffeD)paddle答案:B解析:[单选题]32.Transformer中的Q,K,V为什么用不同的权重矩阵生成A)无实际的意义B)减小表达能力C)降低了泛华能力D)这样可以在不同的空间上进行投影,增加表达能力答案:D解析:[单选题]33.tf.to_float的作用是什么A)将张量转换为float32类型.B)转为64位浮点类型-float64C)转为32位整型-int32D)转为64位整型-int64答案:A解析:[单选题]34.交叉熵函数一般用作定义什么函数?A)损失函数B)激活函数C)relu函数D)sigmoid函数答案:A解析:[单选题]35.语料库以语料库结构进行划分可分为()A)通用语料库与专用语料库B)平衡结构语料库与自然随机结构语料库C)共时语料库与历时语料库D)单媒体语料库与多媒体语料库答案:B解析:[单选题]36.对于数据的处理过程过采样和欠采样可以解决什么问题的A)词向量化处理B)提取特征C)样本类别不平衡D)文本摘要处理答案:C解析:[单选题]37.神经网络的运行流程是从输入层-->()-->输出层A)输出层B)隐藏层C)输出层D)激活函数层答案:B解析:[单选题]38.()是指从文本中抽取出特定的事件或事实信息。例如,从时事新闻报道中抽取出某一恐怖事件的基本信息,如时间、地点、事件制造者、受害人、袭击目标、伤亡人数等。A)文本分类B)文本聚类C)信息抽取D)信息过滤答案:C解析:[单选题]39.tf.Variable(tf.random_normal([20,10,3,16])),在该操作中,关于定义的卷积核的高度,下列选项中描述正确的是?A)10B)20C)16D)3答案:B解析:[单选题]40.以下四个选项中,哪个选项的缩写是RNNA)卷积神经网络B)标准神经网络C)循环神经网络D)自注意力机制答案:C解析:[单选题]41.超参数使我们模型道中必要的阐述,关于超参数范围中说法正确的是A)随机取值可以提升搜索效率B)随机取值就是随机均匀取值C)范围就是[0,1]D)随机取值对搜索无影响答案:A解析:[单选题]42.下面那个算法可以做关键词的提取A)FastTextB)LSTMC)TF-IDFD)TextRNN答案:C解析:[单选题]43.在TF-IDF计算中和哪些因素相关A)不确定B)词意C)词序D)词权重答案:D解析:[单选题]44.哪个不属于数据的处理阶段A)预处理B)特征提取C)分类算法D)文本表示答案:C解析:[单选题]45.以下哪个是产生式模型的算法?A)HMMB)SVMC)CRFD)MEMM答案:A解析:[单选题]46.关于CBOW与Skip-Gram算法,以下说法不正确是?A)CBOW和Skip-Gram都是可以训练向量的方法,但是skip-Gram要比CBOW更快一些B)CBOW是根据某个词前面的n个或者前后n个连续的词,来计算某个词出现概率C)无论是CBOW模型还是skip-gram模型,都是可以Huffman树作为基础的D)Skip-Gram就是根据某个词然后分别计算它前后几个词的各个概率答案:A解析:[单选题]47.无指导学习是指()A)没有语料库直接学习B)使用未标注的语料库直接学习C)没有专业技能专家指导直接学习D)没有学习理论直接学习答案:B解析:[单选题]48.造成RNN梯度消失与下面哪个因素有关A)激活函数求导B)学习率C)批处理数D)网络层数答案:A解析:[单选题]49.EM算法的得到广泛的应用,具体它是一个什么优化算法A)梯度下降优化算法B)非梯度优化算法C)动态优化算法D)不确定答案:B解析:[单选题]50.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:A)有放回的简单随机抽样B)无放回的简单随机抽样C)分层抽样D)渐进抽样答案:D解析:[单选题]51.经典的回归算法,线性回归中,使用到的目标函数是下列哪个?A)信息增益B)信息熵C)交叉熵D)均方误差答案:D解析:[单选题]52.以下哪些算法是分类算法A)DBSCANB)C4.5C)K-MeanD)EM答案:B解析:[单选题]53.不是聊天机器人模型优化方法的是()。A)损失函数B)优化器C)自适应梯度法D)神经网络答案:C解析:[单选题]54.哪个激活函数用于类似文本分类的二分类任务A)tanhB)reluC)softmaxD)sigmoid答案:D解析:[单选题]55.LDA中的一个函数指的是以下哪个?A)Gibbs采样B)pLSAC)beta分布D)gamma函数答案:D解析:[单选题]56.在寻找最优结构树的过程中,经常会使用到以下哪个算法A)逻辑回归B)线性回归C)聚类D)贪心算法答案:D解析:[单选题]57.前项算法中,除了需要有联合权重w,还需要有一个什么函数,才能正常的进行计算A)激活函数B)正弦函数C)余弦函数D)都可以答案:A解析:[单选题]58.下列不是机器学习中典型的分类是()A)贝叶斯分类器B)支持向量机C)最大熵模型D)分类机器答案:D解析:[单选题]59.已知一个单层神经网络的二进制输入x1,x2∈{0,1}和输出hΘ(x),当权重不同时,可以表示不同的逻辑运算,则以下表达式为逻辑与的是A)h(x)=g(-5+15x1+15x2)B)h(x)=g(-10+15x1+15x2)C)h(x)=g(-30+20x1)D)h(x)=g(-20+10x1+15x2)答案:D解析:[单选题]60.使用withtf.Session()assess创建的会话时,在关闭的同时会()释放资源A)自动B)无法C)不能D)手动答案:A解析:[单选题]61.要求关键词提取算法应具有的性质不包括()A)可读性B)高速性C)简洁性D)健壮性答案:C解析:[单选题]62.不属于中文的实体边界识别变得更加有挑战性原因的是)。A)中文词数量繁多B)中文词灵活多变C)中文词的嵌套情况复杂D)中文词存在简化表达现象答案:A解析:[单选题]63.relu激活函数取负数时,激活后的数值为:A)-1B)0C)1D)x答案:B解析:[单选题]64.()是不可缺少的,没有(),就形成不了完整的句子A)来源格B)目标格C)受事格D)结构格答案:C解析:[单选题]65.以下四个选项当中哪个方法被用于句子中词意模糊A)对比模糊词汇与近义词在词典上的定义B)同指(Co-reference)解决方案,使用先前句子中包含的正确词意解决模糊单词的含义。C)使用句子的依存解析理解含义D)不确定答案:A解析:[单选题]66.下列选项中,处理梯度消失问题效果最好的函数是哪个?A)sigmoidB)tanhC)reluD)Leakyrelu答案:D解析:[单选题]67.如果一个[a,b]的区间,从中随机出一个值x,那么下列说法中不正确的是?A)取最小值的对数得到a的值B)取最小值的对数得到b的值C)取最大值的对数得到b的值D)取任意值r,则超参数设置为10的r次方答案:B解析:[单选题]68.以下选项中关于拟合的问题,说法描述正确的是?A)过拟合的现象是训练集准确率低,而测试集准确率高B)欠拟合的现象是训练集和测试集准确率相近C)尽量不要出现适度拟合,会造成新数据准确率低D)欠拟合是指验证集和测试集的准确率都无法保证正常业务使用答案:D解析:[单选题]69.什么样的神经网络模型被称为深度学习模型?A)加入更多层,使神经网络的深度增加B)有维度更高的数据C)当这是一个图形识别的问题时D)以上都不正确答案:A解析:[单选题]70.以下的四个选项当中,哪个选项的算法指的是有监督的学习方式A)聚类B)降维C)回归算法D)PCA答案:C解析:[单选题]71.下列不属于神经细胞结构的是()A)树突B)突触C)细胞体D)大脑答案:D解析:[单选题]72.下列不属于抽象模型的是()A)概率统计模型B)比例模型C)符号模型D)流程图答案:B解析:[单选题]73.如果训练完成的模型存在过拟合现象会造成什么影响A)在训练集上的效果很好,但是在测试集上的效果很差B)在训练集上的效果差,在测试集上的效果也差C)在训练集上的效果很好,在测试集上的效果也很好D)在训练集上的效果很差,但是在测试集上的效果很好答案:A解析:[单选题]74.自动驾驶是基于哪种技术提出的A)BP算法B)神经网络C)前向算法D)NFC答案:A解析:[单选题]75.朴素贝叶斯分类器的特征不包括()A)孤立的噪声点对该分类器的影响不大B)数据的缺失值影响不大C)要求数据的属性是相互独立的D)条件独立的假设可能不成立答案:C解析:[单选题]76.Transformer使用了__机制,使它的特征提取效果很好A)word2vecB)ELMOC)AttentionD)one-hot答案:C解析:[单选题]77.不属于常用的正则表达式函数的是()。A)matchB)searchC)findallD)matplotlib函数答案:D解析:[单选题]78.关于贝叶斯判别规则,下列选项中描述正确的是?A)就是判断自变量和因变量之间的关系B)把特征向量X落入某类集群wi的条件概率平P(wi/X)当成分类判别函数,把X落入某集群的条件概率最大的类为X的分类这种判别规则叫贝叶斯判别规则C)不确定D)就是通过选择最优的超平面去进行最好的分类超平面答案:B解析:[单选题]79.tanh激活函数相比sigmoid是有优势的,体现在哪些方面A)解决了sigmoid输出为非0中心的问题B)tanh不易饱和C)tanh解决了sigmoid的指数运算D)tanh不会造成梯度消失答案:A解析:[单选题]80.使用网格搜索寻找超参数的话,有什么缺点A)准确率高B)查找的快C)计算资源少D)十分的耗时答案:D解析:[单选题]81.AUC值是什么?A)AUC值被定义为ROC曲线下的面积B)AUC值就是ROC曲线上方的面积C)AUC是一个随机定义的值D)不确定答案:A解析:[单选题]82.以下哪个可以作为NNLM模型输入层的输入A)one-hot的表示B)中文汉字C)英文字母D)字符串答案:A解析:[单选题]83.马尔可夫过程模型属于A)假设一个事件的概率仅依赖于过去某一状态B)假设一个事件的概率仅依赖于过去所有状态C)假设一个事件的概率仅依赖于现有状态D)其余选项皆错答案:C解析:[单选题]84.下列不属于经典语料库的是A)BrownB)NoteBankC)FranmeNetD)PennTressBank答案:B解析:[单选题]85.问答系统流程由问题理解、(),答案生成3个部分组成。A)词性标注B)关键词提取C)问题分类D)知识检索答案:D解析:[单选题]86.下列不是汉语自动分词的主要困难的是()A)分词规范B)语句顺序C)歧义切分D)未登录词的识别答案:B解析:[单选题]87.移进-归约算法中操作有()(1)移进(2)归约(3)接收(4)拒绝A)(1)(2)B)(1)(2)(3)C)(3)(4)D)(1)(2)(3)(4)答案:D解析:[单选题]88.使用随机森林做分类,会影响分类效果的因素有哪些?A)森林中任意两棵树的相关性:相关性越大,错误率越大;B)森林中任意两棵树的相关性:相关性越小,错误率越大;C)森林中任意两棵树的相关性:相关性越大,错误率越小;D)不确定答案:A解析:[单选题]89.命题是指具有()的陈述句A)真假B)真假意义C)对错意义D)对错答案:B解析:[单选题]90.下列不是语料库的类型的是A)通用语料库B)生词语料库C)历史语料库D)单词语料库答案:C解析:[单选题]91.以下哪个函数常用于解决二分类问题A)tanhB)sigmoidC)softmaxD)relu答案:B解析:[单选题]92.什么是决策树,如何去理解决策树?A)一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别B)两个变量之间的关系是二次函数的关系,图像是条抛物线C)两个变量之间的关系是一次函数关系的关系D)两个变量之间的关系是指数函数的关系答案:A解析:[单选题]93.关于数据信息的处理方式,以下描述错误的是:A)粒度是指数据仓库小数据单元的详细程度和级别;B)数据越详细,粒度就越小,级别也就越高;C)数据综合度越高,粒度也就越大,级别也就越高;D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.答案:C解析:[单选题]94.使用马尔科夫链的算法有:A)HMMB)SVMC)CRFD)MEMM答案:A解析:[单选题]95.以下哪个不属于长短期记忆网络A)输入门B)输出门C)更新门D)遗忘门答案:C解析:[单选题]96.GPT和ELMO相比之下他都有哪些优点A)使用了LSTMB)使用了TransformerC)处理长序列的时候会丢失一些信息D)准确率不如ELMO答案:B解析:[单选题]97.下列算法中,训练数据集是无label的数据,是杂乱无章的,经过变换后变得有序,先无序,后有序是哪个算算法A)SVMB)逻辑回归C)线性回归D)聚类答案:D解析:[单选题]98.哪些是产生式模型A)HMMB)SVMC)CRFD)MEMM答案:A解析:[单选题]99.以下哪项是主要用于自然语言处理的网络结构A)AlexNetB)ResNetC)BertD)LeNet答案:C解析:[单选题]100.RF(随机森林)与GBDT之间的区别A)都是由多棵树组成,最终的结果都是由多棵树一起决定。B)组成随机森林的树可以串行生成,而GBDT是并行生成C)随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和D)随机森林对异常值敏感,而GBDT对异常值不敏感答案:C解析:[单选题]101.下列选项中哪个可以很好的解决梯度爆炸的问题?A)梯度剪切,正则B)增加拟合数据C)增加训练数据维度D)增加隐藏层答案:A解析:[单选题]102.下列关于LSTM说法不正确的是()。A)通过改进使RNN具备避免梯度消失的特性B)LSTM只能够刻画出输入数据中的短距离的相关信息,不能够捕捉到具有较长时间间隔的依赖关系C)LSTM神经网络模型使用门结构实现了对序列数据中的遗忘与记忆D)使用大量的文本序列数据对LSTM模型训练后,可以捕捉到文本间的依赖关系,训练好的模型就可以根据指定的文本生成后序的内容答案:B解析:[单选题]103.TF-IDF的计算方式是什么A)先计算词频TF,再计算逆文档频率IDFB)先计算词频IDF,再计算逆文档频率TFC)先计算逆文档频率TF,再计算词频IDFD)不确定答案:A解析:[单选题]104.谷歌开源出来的bert预训练模型中可以接受的最大句子长度是__?A)128B)512C)768D)64答案:A解析:[单选题]105.计算TensorFlow以硬件平台通常分为哪些版本A)CPU,GPU,TPUB)CPU,GPUC)CPUD)TPU答案:A解析:[单选题]106.不是逻辑回归与朴素贝叶斯的区别是A)逻辑回归是生成模型B)朴素贝叶斯是判别模型C)朴素贝叶斯需要独立假设D)逻辑回归不需要特征之间的线性答案:D解析:[单选题]107.以下选项中关于拟牛顿法,描述正确的是?A)实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的B)是一种在实数域和复数域上近似求解方程的方法C)改善每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷,它使用正定矩阵来近似Hessian矩阵的逆,从而简化了运算的复杂度D)不确定答案:C解析:[单选题]108.深度学习中最常使用的框架就是TensorFlow,该框架中的matmul方法的作用是什么A)相与B)乘积C)相除D)相加答案:B解析:[单选题]109.以下说法当中,LDA是可以做什么的A)对图像进行文本B)对图像进行特征提取C)对文档的主题进行分类或聚类D)以上都正确答案:C解析:[单选题]110.朴素贝叶斯作为常用的方法,它是以()为基础的分类方法。A)概率论B)线性代数C)微积分D)都不是答案:A解析:[单选题]111.下列关于不确定性知识描述错误的是()A)不确定性知识是不可以精确表示的B)专家知识通常属于不确定性知识C)不确定性知识是经过处理过的知识D)不确定性知识的事实与结论的关系不是简单的?是?或?不是?答案:C解析:[单选题]112.以下关于LightGBM框架的优点说法正确的是?A)更慢的训练速度B)更低的内存消耗C)更差的准确率D)不支持分布式答案:B解析:[单选题]113.MSE(MeanSquareError)均方误差可以用到以下哪个算法当中A)逻辑回归B)GBDTC)聚类D)KNN答案:B解析:[单选题]114.tf.mul()函数对Tensor的作用是什么A)相减B)相除C)相乘D)相加答案:C解析:[单选题]115.下面哪个对batch归一化的解释不正确?A)使参数搜索问题变得容易B)使神经网络对超参数的选择更加稳定C)超参数的范围更加庞大D)仅作用于输入层答案:D解析:[单选题]116.以下哪个可以将文本转化成TokensA)CountVectorizerB)TF-IDFC)词袋模型(BagofWords)D)NERs答案:A解析:CountVectorizer可帮助完成上述操作,而其他方法则不适用。第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.以下关于KNN的四个选项中,说法正确的是()。A)无需参数估计,无需训练B)适合用于稀有事件的分类问题C)对变量之间的共线性比较敏感D)可解释性差答案:ABD解析:[多选题]118.深度学习在自然语言中的应用有哪些A)机器创作B)个性化推荐C)文本分类D)情感分析答案:ABCD解析:[多选题]119.经典的概率模型有()。A)不确定B)古典概型C)几何概型D)以上都正确答案:BC解析:[多选题]120.以下哪些是卷积神经网络的内容A)卷积B)池化C)循环神经结构D)以上都不对答案:AB解析:[多选题]121.传统分类方法有哪些A)FastTextB)特征工程C)分类器D)TextRNN答案:BC解析:[多选题]122.GBDT中如果按照高维的ID特征做分裂时都有什么缺点A)计算量大B)子树的泛化能力弱C)容易过拟合D)以上都正确答案:ABCD解析:[多选题]123.以下关于LightGBM对XGBoost的优化说法正确的是A)基于Histogram的决策树算法B)带深度限制的Leaf-wise的叶子生长策略C)直方图做差加速直接D)支持类别特征(CategoricalFeature)答案:ABCD解析:[多选题]124.人工智能最终是想要机器具有什么样的效果A)感知B)理解C)决策D)证明答案:ABC解析:[多选题]125.过拟合的形成原因可能是什么A)数据量少B)数据样本中的噪声太大C)迭代次数过多,拟合了噪声D)参数太多答案:ABCD解析:[多选题]126.采用EM算法求解的模型有哪些A)混合高斯B)协同过滤C)k-meansD)以上都正确答案:ABCD解析:[多选题]127.Adaboost的权重有:A)A:样本权重B)B:代价函数C)C:梯度下降D)D:弱分类器权重答案:AD解析:[多选题]128.哪些属于Sequence数据A)语音识别B)情感分类C)机器翻译D)DNA序列分析答案:ABCD解析:[多选题]129.关于TensorFlow中的语句,tf.variables_initializer以下描述正确的是A)初始化一个变量B)初始化多个变量C)初始化全部变量D)初始化常量答案:ABC解析:[多选题]130.情感分析常用方法有()A)基于情感词典的方法B)基于文本分类的方法C)基于LDA模型的方法D)基于语料库的方法答案:ABC解析:[多选题]131.下列常用的激活函数,sigmoid,relu,tanh三个激活函数对比,下列说法正确的是A)都可以做非线性的变换B)都可以做线性的变换C)变换后Y的取值范围不相同D)变换后Y的取值范围相同答案:AC解析:[多选题]132.LDA当中的Topic个数怎么确定A)基于经验主观判断、不断调试、操作性强、最为常用。B)基于困惑度C)使用Log-边际似然函数的方法,这种方法也挺常用的。D)基于主题之间的相似度:计算主题向量之间的余弦距离,KL距离等。答案:ABCD解析:[多选题]133.自然语言处理的应用领域包括()A)信息检索B)信息提取C)问答系统D)自动文摘答案:ABCD解析:[多选题]134.在k-NN中,由于维数的存在,很可能过度拟合。你将考虑使用以下哪个选项来解决此问题?A)降维B)特征选择C)不确定D)以上都正确答案:AB解析:[多选题]135.下面四个算法中,其中有哪些算法可以处理MNIST数据中的分类?A)KNNB)逻辑回归C)k-meanD)PCA答案:AB解析:[多选题]136.文本分类的步骤包括()。A)数据集准备B)特征抽取C)模型训练D)分类结果评价答案:ABCD解析:[多选题]137.决策树有什么特点,以及优点A)计算复杂度低B)输出结果易于理解C)对中间缺失值不过敏D)可以处理不相关的特征答案:ABCD解析:[多选题]138.GPT与ELMO的区别是什么A)特征提取不是用的RNN,而是TransformerB)GPT适用的LSTMC)采用的是单向的语言模型D)ELMO使用了Transformer答案:AC解析:[多选题]139.在聚类算法中,当数据缺失时怎么处理A)把缺失值用一个数值,例如0表示B)均值,中值,分位数、众数,随机数,上下数据填充,插值法;C)用算法拟合进行填充;D)以上都正确答案:ABCD解析:[多选题]140.误差反向传播算法中的两个步骤指什么?A)信息传播B)激活函数C)激励传播D)权重更新答案:CD解析:[多选题]141.LightGBM在Leaf-wise之上增加了一个最大深度的限制,是为了什么A)高效率B)低效率C)防止过拟合D)防止欠拟合答案:AC解析:[多选题]142.基于规则的分词方法,通常会遇到未登录词问题,未登录词也称为生词,未登录词可以分为以下()A)日常生活出现的普通新词汇B)专有名词C)研究领域的专业名词D)其他专用名词答案:ABCD解析:[多选题]143.LightGBM的优化方向有哪些A)带深度限制的Leaf-wise的叶子生长策略B)直方图做差加速直接C)支持类别特征(CategoricalFeature)D)以上不都是答案:ABC解析:[多选题]144.深度学习应用面非常的广泛,在自然语言中它有哪些应用A)推荐系统B)文本分类C)机器创作D)机器翻译答案:ABCD解析:[多选题]145.语料库的用途有()A)用于语言研究B)用于编纂工具参考书籍C)用于语言教学D)用于NLP答案:ABCD解析:[多选题]146.中文实体识别的挑战性主要表现在以下()A)中文词灵活多变B)中文词的嵌套情况复杂C)中文词存在简化表达现象D)以上都不对答案:ABC解析:四、填空题(5题)[多选题]147.GBDT的原理,下面描述正确的是?A)根据训练集训练一颗初始决策树;B)计算之前所有树在此数据集上预测结果之和与真实结果的差值,又叫残差;C)把残差作为当前树作为拟合的目标在训练集上训练;D)直到达到设置的阈值--如树的个数,早期停止策略答案:ABCD解析:[多选题]148.BOW模型有什么特点A)高纬度B)低纬度C)高稀疏性D)低稀疏性答案:AC解析:[多选题]149.集成学习中boosting算法有:A)A:RandomForestClassifierB)B:AdaboostC)C:XgboostD)D:RandomForestRegressor答案:BC解析:[多选题]150.朴素贝叶斯不是以()为基础的分类方法。A)概率论B)天文学C)地理学D)物理学答案:BCD解析:[多选题]151.机器学习的方法有哪些?A)逻辑回归B)递归神经网络C)朴素贝叶斯D)K-Means答案:ACD解析:[多选题]152.kmeans中的距离是怎么定义的,kmeans计算距离的权重怎么分配A)距离定义为∣∣xi−μj∣∣2||x_i-\mu_j||^2∣∣xi−μj∣∣2其中,xix_ixi是样本点,μj\mu_jμj是中心点。B)权重均匀,或者基于距离的C)不确定D)以上都正确答案:AB解析:[多选题]153.RNN常见的应用领域有()A)文本生成B)语言模型C)机器翻译D)语音识别答案:ABCD解析:[多选题]154.以下多个选项其中属于AI描述其主要的三大主义或学派的是?A)机器学习B)连接主义C)行为主义D)符号主义答案:BCD解析:[多选题]155.在神经网络中,单个神经元能解决什么问题A)与B)或C)非D)异或答案:ABC解析:[多选题]156.激活函数是常用于做非线性的变换,常用的激活函数有哪些A)reluB)tanhC)Leaky-ReluD)softplus答案:ABCD解析:[多选题]157.CNN的池化层包括哪几种A)卷积B)最大池化C)最小池化D)平均池化答案:BD解析:[多选题]158.专家系统知识表示的方法主要有哪些?A)逻辑表示法(谓词表示法)B)框架C)产生式D)语义网络答案:ABCD解析:[多选题]159.XGBoost和GBDT有很多异同点,针对于他们的不同点,下列说法正确的是A)GBDT是机器学习算法,XGBoost是该算法的工程实现。B)在使用CART作为基分类器时,XGBoost显式地加入了正则项来控制模型的复杂度,有利于防止过拟合,从而提高模型的泛化能力。C)GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代价函数进行二阶泰勒展开,可以同时使用一阶和二阶导数。D)传统的GBDT采用CART作为基分类器,XGBoost支持多种类型的基分类器,比如线性分类器。答案:ABCD解析:[多选题]160.常用的优化器包括哪些A)AdamB)SGDC)momentumD)Ridge答案:ABC解析:[多选题]161.在训练模型的阶段,如果说发生了过拟合现象,以下四个选项中,可以通过哪些方式解决A)增加数据量B)减少数据量C)增加迭代次数D)减少迭代次数答案:AD解析:[多选题]162.生成式模型在统计学角度与判别式模型相比有什么优点A)适用较多类别的识别B)能更充分利用先验知识C)分类边界更灵活D)研究单类问题灵活性强答案:BD解析:[多选题]163.可用于文本分类的机器学习方法有()A)支持向量机B)K最近邻C)神经网络D)决策树答案:ABCD解析:[多选题]164.NLP所涉及的领域A)信息抽取B)问答系统C)数据预处理D)模型构建答案:AB解析:[多选题]165.语料库管理程序的基本要求包括()A)用户界面友好B)程序完备性好C)数据安全D)可以检索答案:ABCD解析:[多选题]166.选出逻辑回归的优点()A)实现简单B)准确度很高C)分类时计算量小D)容易过拟合答案:AC解析:[多选题]167.使用了Transformer做特征提取的预训练模型有哪些A)BERTB)ALBERTC)GPTD)ELMO答案:ABC解析:[多选题]168.LSTM中有三个门去控制C,是哪三个门A)遗忘门B)输入门C)输出门D)以上都正确答案:ABCD解析:[多选题]169.自然语言的应用场景有:A)语音识别B)自动翻译C)控制装置D)人脸识别答案:ABC解析:[多选题]170.正常情况下,集成学习一般有哪些步骤A)不确定B)生产一组?个体学习器C)以上都正确D)用某种策略将他们结合起来答案:BD解析:[多选题]171.以下四个选项中,关于viterbi算法说法正确的是A)挑选出最优的路径B)是前向算法变体C)时间复杂度比现象算法低很多D)找到最优解答案:ABCD解析:[多选题]172.激活函数可以做非线性的变换,以下常用的激活函数是__?A)SigmoidB)ReluC)TanhD)LeakyRelu答案:ABCD解析:[多选题]173.以下选项当中,哪些项构成了XGBoost的目标函数?A)损失函数B)正则项C)梯度下降D)以上都正确答案:AB解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.BERT和ELMO使用的都是是单向的TransformerA)正确B)错误答案:错解析:[判断题]175.基于规则的分词能够较好地处理未登录词和歧义词,不需要人为的搭建和维护词典。错A)正确B)错误答案:错解析:[判断题]176.Jieba框架是一个用于英文字符处理的工具包A)正确B)错误答案:错解析:[判断题]177.各种不同的编码标准互不兼容,一个编码在不同的编码标准内可能代表不同的字符A)正确B)错误答案:对解析:[判断题]178.HAL是一个具有高级语言处理能力,并且能够理解汉语和说汉语的智能计算机。()A)正确B)错误答案:错解析:[判断题]179.精准率就是真正正确的占所有预测为正的比例。A)正确B)错误答案:对解析:[判断题]180.PCA中文名称主成分分析A)正确B)错误答案:对解析:[判断题]181.决策树学习的本质是:从训练集中归纳出来一组分类规则A)正确B)错误答案:对解析:[判断题]182.概率图模型是用图来表示变量概率依赖关系的理论,结合概率论与图论的知识,利用图来表示与模型有关的变量的联合概率分布A)正确B)错误答案:对解析:[判断题]183.在LSTM中sigmoid的激活函数的作用是作为一个门A)正确B)错误答案:对解析:[判断题]184.按照向量表征的最小单元,可将向量分为字符向量、词向量和句子向量。对A)正确B)错误答案:对解析:[判断题]185.BagofWord和One-Hot以及N-gram都会造成词表的膨胀A)正确B)错误答案:对解析:[判断题]186.基于词自动聚类的n-gram模型的参数空间最小。A)正确B)错误答案:错解析:[判断题]187.最大匹配法的优点是程序简单易行,开发周期短A)正确B)错误答案:对解析:[判断题]188.BERT将编码的向量式512维A)正确B)错误答案:错解析:[判断题]189.Boosting,迭代,即通过迭代多棵树来共同决策。A)正确B)错误答案:对解析:[判断题]190.bert是很好的语言模型A)正确B)错误答案:错解析:[判断题]191.句法分析是自然语言理解的关键步骤A)正确B)错误答案:对解析:[判断题]192.正则表达式本质是一系列由特殊符号组成的字串,这个字串即正则表达式。对A)正确B)错误答案:对解析:[判断题]193.通过Attention可以给赋予一个不同大小的权重值A)正确B)错误答案:对解析:[判断题]194.BP算法指的是计算神经网络参数通过梯度求导进行更新的方法。A)正确B)错误答案:对解析:[判断题]195.如果特征确实比较多,缺失比较多的话可以考虑删除该特征。A)正确B)错误答案:对解析:[判断题]196.准确率,召回率,精确率的计算相同A)正确B)错误答案:错解析:[判断题]197.机器学习的K-Means算法可用于文本分类。错A)正确B)错误答案:错解析:[判断题]198.语法层次的歧义主要表现在词类歧义。()A)正确B)错误答案:错解析:[判断题]199.在中文中,一个词的词性很多时候都不是固定的,一般表现为同音同形的词在不同场景下,其表示的语法截然不同,这就为词性标注带来了很大的困难。A)正确B)错误答案:对解析:[判断题]200.LightGBM虽然在很多方面上做了优化,但是占用的内存会比较大A)正确B)错误答案:错解析:[判断题]201.XGBoost为了减少树的复杂度,可以加入正则项A)正确B)错误答案:对解析:[判断题]202.NLTK的sorted函数不能对词汇表中的词按照英文字母进行排序。错A)正确B)错误答案:错解析:[判断题]203.最大匹配法是最简单的分词方法,他部分使用词典进行分词,如果词典好,则分词的效果好A)正确B)错误答案:错解析:[判断题]204.文本离散表示会导致无法理解诸如?我为你鼓掌?和?你为我鼓掌?两个语句之间的区别。对A)正确B)错误答案:对解析:[判断题]205.采用sigmoid等函数,算激活函数时(指数运算),计算量大A)正确B)错误答案:对解析:[判断题]206.TextRank算法的基本思想来自Google的PageRank算法。对A)正确B)错误答案:对解析:[判断题]207.停用词是指虚词、代词或者没有特定含义的动词、名词等,在做文本预处理的时候需要去停用词。A)正确B)错误答案:对解析:[判断题]208.现在汉字输入系统主流是采用以词为单位的输入方式,有的甚至是以句子为单位进行输入A)正确B)错误答案:对解析:[判断题]209.Word2vec最常解决的问题就是一词多意问题A)正确B)错误答案:错解析:[判断题]210.L2其实就是在目标函数上加入了L2范数A)正确B)错误答案:对解析:[判断题]211.EM中的E步,利用当前估计的参数值,求出在该参数下隐含变量的条件概率值A)正确B)错误答案:对解析:[判断题]212.tanh函数与sigmoid函数向下平移和伸缩一致A)正确B)错误答案:对解析:[判断题]213.文本分词的目的在于使用单词来表示文本特征。对A)正确B)错误答案:对解析:[判断题]214.损失函数(lossfunction)是用来估量你模型的预测值f(x)与真实值Y的不一致程度A)正确B)错误答案:对解析:[判断题]215.mini-batch:实践中最好选择不大不小的mini-batch,得到了大量向量化,效率高,收敛快。A)正确B)错误答案:对解析:[判断题]216.NLP是计算机科学领域以及人工智能领域的一个重要的研究方向,是一门融语言学、计算机科学、数学、统计学于一体的科学。A)正确B)错误答案:对解析:[判断题]217.语料库构建原则包括代表性、结构性、平衡性、规模性等A)正确B)错误答案:对解析:[判断题]218.bert这个需要模型相比较GPT也没有任何提升A)正确B)错误答案:错解析:[判断题]219.LDA算法假设文档中主题的先验分布和主题中词的先验分布都服从狄利克雷分布.A)正确B)错误答案:对解析:[判断题]220.Word2vec中使用了深度网络进行训练A)正确B)错误答案:错解析:[判断题]221.未登录词问题是分词错误的主要来源A)正确B)错误答案:对解析:[判断题]222.正则表达式的?\d?用于匹配一个字母或者数字A)正确B)错误答案:错解析:[判断题]223.拉索回归和岭回归都属于是线性回归A)正确B)错误答案:对解析:[判断题]224.扣留估计算法的思想是:把训练数据分成两部分,一部分建立最初的模型,然后另一部分来精炼这个模型A)正确B)错误答案:对解析:[判断题]225.隐马尔科夫模型的优点是该方法对过程的状态预测效果良好,可考虑用于生产现场危险状态的预测。缺点是不适宜用于系统中长期预测A)正确B)错误答案:对解析:[判断题]226.seq2seq是一种经典的端到端的编解码模型A)正确B)错误答案:对解析:[判断题]227.增大正则化并不能防止过拟合的发生A)正确B)错误答案:错解析:[判断题]228.决策树通常有三个步骤:特征选择,决策树的生成,决策树的修剪A)正确B)错误答案:对解析:[判断题]229.NLTK提供了超过50多个素材库和词库资源的易用接口,涵盖了分词、词性标注、命名实体识别、句法分析等各项NLP领域的功能。对A)正确B)错误答案:对解析:[判断题]230.语句fromnltkimportword_tokenize是用于导入nltk中的英文词性标注模块。错A)正确B)错误答案:错解析:[判断题]231.多隐藏层的神经网络比单隐藏层的神经网络工程效果更差A)正确B)错误答案:错解析:[判断题]232.反向传播依据微积分中的链式法则,沿着从输出层到输入层的顺序,依次计算并存储目标函数有关神经网络各层的中间变量以及参数的梯度A)正确B)错误答案:对解析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论