统计机器学习概论.ppt

上传人：q*** IP属地：河南上传时间：2020-02-21 格式：PPT 页数：121 大小：3.94MB 积分：24 举报 版权申诉

已阅读5页，还剩116页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

统计机器学习概论 IntroductiontoStatisticalMachineLearning 主讲教师田永鸿北京大学数字视频编码技术与系统国家工程实验室为什么需要机器学习美国航空航天局JPL实验室的科学家在 Science 2001年9月上撰文指出机器学习对科学研究的整个过程正起到越来越大的支持作用该领域在今后的若干年内将取得稳定而快速的发展Machinelearningformsthecoreofmaypresent dayAIapplicationsGaryAnthes FutureWatch AIcomesofage 2009 1 26 2 3 为什么数字媒体技术中需要机器学习媒体处理媒体类型单媒体复合媒体应用模式单机应用模式网络应用模式获取创建编辑管理传输检索描述展现说明编码统计学习与模式识别 4 机器学习示例 5 BooksandReferences 主要参考书T Hastie R Tibshirani J Friedman TheElementsofstatisticalLearning DataMining Inference andPrediction 2001 Springer Verlag 其他参考书V N Vapnik TheNatureofStatisticalLearningTheory 2nded Springer 2000 6 提纲机器学习方法概述贝叶斯决策理论BayesianDecisionTheory常见统计学习方法机器学习的难题与挑战附录 1 参考资料2 代表性机器学习开发包介绍 7 一统计学习方法概述 8 机器学习的发展机器学习神经科学与认知科学数学计算 James 19世纪末神经元相互连接McCulloch Pitts 20世纪中期兴奋和抑制 Hebb 20世纪中期学习律神经科学有限样本统计理论线性空间表示 Samuel 符号机器学习机器学习研究历程王珏机器学习研究回顾与趋势 2004 9 学习系统的一般模型 InputVariables HiddenVariables OutputVariables 11 机器学习的基本问题和方法机器学习根据给定的训练样本求对某系统输入输出之间依赖关系的估计使它能够对未知输出作出尽可能准确的预测机器学习问题的表示根据n个独立同分布观测样本确定预测函数f x w 在一组函数 f x w 中求一个最优的函数f x w0 对依赖关系进行估计使预测的期望风险最小 Simon的学习模型 12 学习问题的一般表示学习目标Givenani i d l samplez1 zldrawnfromafixeddistributionF z Forafunctionclass lossfunctionsQ z with in Wewishtominimizetherisk findingafunction Inthecaseofequalrisk itbecomestominimizetheerrorratio 相关概念损失函数lossfunction L Q theerrorofagivenfunctiononagivenexample风险函数riskfunctional R theexpectedlossofagivenfunctiononanexampledrawnfromF x y 13 学习问题的一般表示学习的目的在于使期望风险最小化由于可利用的信息只有样本期望风险往往无法计算经验风险最小化归纳原则 TheEmpiricalRiskMinimization ERM InductivePrinciple 核心思想用样本定义经验风险 Definetheempiricalrisk sample trainingerror Definetheempiricalriskminimizer Least squaresandMaximum likelihoodarerealisationsofERM 14 ERM准则与统计学习理论的发展经验风险最小并不意谓着期望风险最小例子神经网络的过学习问题训练误差小并不总能导致好的预测效果若对有限的样本来说学习能力过强足以记住每个样本此时经验风险很快就可以收敛到很小甚至零但却根本无法保证它对未来样本能给出好的预测需要建立在小样本情况下有效的学习方法小样本条件下的统计学习理论支持向量机 SVM WhyLearningisDifficult Givenafiniteamountoftrainingdata youhavetoderivearelationforaninfinitedomainInfact thereisaninfinitenumberofsuchrelations thehiddentestpoints 15 LearningasaSearchProblem 16 17 三类基本的机器学习问题 1 模式分类问题输出y是类别标号两类情况下y 1 1 预测函数称作指示函数 IndicatorFunction 损失函数定义见下式使期望风险最小就是Bayes决策中使错误率最小 18 三类基本的机器学习问题 2 回归问题输出y是连续变量它是x的函数损失函数定义见下式 19 三类基本的机器学习问题 3 概率密度估计问题根据训练样本确定x的概率分布p x w 则损失函数可定义为 20 统计学习的基本方法有监督无监督学习有监督 Supervised 分类回归无监督 Unsupervised 概率密度估计聚类降维半监督 Semi supervised EM Co training其他学习方法增强学习 ReinforcementLearning 多任务学习 Multi tasklearning 21 有监督学习标定的训练数据训练过程根据目标输出与实际输出的误差信号来调节参数典型方法全局 BN NN SVM DecisionTree局部 KNN CBR Case basereasoning A11 A12 A1mA21 A22 A2m An1 An2 Anm ninstance mattributes Output C1 C2 Cn Training 22 无监督学习不存在标定的训练数据学习机根据外部数据的统计规律 e g Cohension divergence 来调节系统参数以使输出能反映数据的某种特性典型方法K means SOM 示例聚类 A11 A12 A1mA21 A22 A2m An1 An2 Anm ninstance mattributes Output C1 C2 Cn XX X Task 半监督学习结合少量的标定训练数据和大量的未标定数据来进行学习典型方法Co training EM Latentvariables 23 A11 A12 A1mA21 A22 A2m An1 An2 Anm ninstance mattributes Output C1 Cn X 24 其他学习方法增强学习 ReinforcementLearning 外部环境对输出只给出评价信息而非正确答案学习机通过强化受奖励的动作来改善自身的性能训练数据包含部分学习目标信息多任务学习 Learnsaproblemtogetherwithotherrelatedproblemsatthesametime usingasharedrepresentation 学习模型 1 单学习模型LinearmodelsKernelmethodsNeuralnetworksProbabilisticmodelsDecisiontrees 学习模型 2 模型组合组合多个弱学习模型来达到更优的性能1 1 1 Boosting 结合低性能学习模型来产生一个强大的分类器组Bagging 结合多个不稳定学习模型来产生稳定预测主动学习 Activelearning 主动选择训练样本 Boosting Boosting是个非常强大的学习方法它组合许多弱分类器来产生一个强大的分类器组弱分类器性能只比随机选择好一点设计简单且计算花费低最常用的弱分类器是决策树常见的Boosting算法离散AdaBoost 实数AdaBoost LogitBoost和GentleAdaBoost它们有非常类似的总体结构 27 Boosting 两类问题的算法训练 step1 3 和估计 step4 为每一个样本初始化使它们具有相同的权值 step2 然后一个弱分类器f x 在具有权值的训练数据上进行训练计算错误率和换算系数cm step3b 被错分的样本的权重会增加所有的权重进行归一化并继续寻找若其他分类器M 1次最后得到的分类器F x 是这些独立的弱分类器组合的符号函数 step4 28 Bagging 基本假设 Combiningmanyunstablepredictorstoproduceaensemble stable predictor UnstablePredictor 训练数据的微小变化可能使得预测模型产生大的改变不稳定模型 NeuralNets trees稳定模型 SVM KNN Eachpredictorinensembleiscreatedbytakingabootstrapsampleofthedata 引导样本 obtainedbydrawingNexampleatrandom withreplacement Encouragespredictorstohaveuncorrelatederrors 主动学习 IntermediateSet Clustering Kclusters DiversityCriterion Batch Selectcentroidofeachcluster RepresentativenessCriterion 1 2 3 产生式模型vs判别式模型 Generativemodels 建模联合概率分布利用Bayes theorem典型方法 BN HMM CMF问题的可解释性好Discriminativemodels 直接用函数而非概率来建模典型方法 SVM LDA一般来说性能更好 32 二贝叶斯决策理论 33 Bayes决策理论有什么用用不同方法可能得到多个不同的估计哪个估计更好一些统计决策理论比较统计过程的形式化理论决策是从样本空间S 到决策空间的一个映射表示为D S 评价决策有多种标准对于同一个问题采用不同的标准会得到不同意义下最优的决策 Bayes决策常用的准则最小错误率准则最小风险准则最小条件错误率准则在限定一类错误率条件下使另一类错误率为最小最小最大决策准则 Minimizingthemaximumpossibleloss orMaximizingtheminimumgain LinearDecisionBoundary hyperplane x1 x2 Non linearDecisionBoundary 36 问题描述 ClassificationProblem 给定 m个类训练样本和未知数据目标给每个输入数据标记一个类属性两个阶段建模学习基于训练样本学习分类规则分类测试对输入数据应用分类规则 PebblesStraws 37 最大后验 MaximumAPosterior MAP 分类什么是最优分类器已有类条件概率密度函数Thisiscalledtheclass conditionalprobabilitydescribingtheprobabilityofoccurrenceofthefeaturesoncategory 欲求后验概率makeadecisionthatmaximizetheconditionalprobabilityoftheobject givencertainfeaturemeasurements Alsocalledposteriorprobabilityfunction 38 Bayes最小错误率 MAP 决策 MAP决策以后验概率为判决函数 Choosecategory classthathasthemaximumThisproducestheoptimalperformance minimumprobabilityoferror AclassifierthatachievesthisoptimalperformanceiscalledBayesianclassifier 39 MAP决策的错误率 Bayes决策是一致最优决策使得每个观测值下的条件错误率最小因而保证了平均错误率最小 40 MAP决策的扩展最小Bayesian风险决策的风险做决策要考虑决策可能引起的损失以医生根据白细胞浓度判断一个人是否患血液病为例没病 1 被判为有病 2 还可以做进一步检查损失不大有病 2 被判为无病 1 损失严重 DecisionRisktableTherisktomakeadecision classifyx belongtoclassi toclassj so DecisionRule 41 Bayes决策讨论基于Bayes决策的最优分类器Bayes决策的三个前提类别数确定各类的先验概率P Ci 已知各类的条件概率密度函数p x Ci 已知问题的转换基于样本估计P Ci 和p x Ci 基于样本直接确定判别函数学习问题 42 三主要统计学习方法简介 43 统计学习方法决策树统计推理用数据的似然度 likelihood 和假设 Hypothesis 的概率去预测新实例的值朴素Bayes方法 Na veBayes NB 基于实例的学习最近邻方法 NearestNeighbor 神经网络 NeuralNetworks 支持向量机 SupportVectorMachine 典型聚类方法 K Means 3 1DecisionTrees DecisionTrees CART Breiman 1984 C4 5 Quinlan 1993 J48 46 3 2Bayesian学习基本思想给定训练数据计算每个假设的概率利用此概率来进行预测注预测时利用所有的假设而不仅仅利用最好的一个参数估计问题若训练数据独立同分布 i e i i d 则对分类问题需要估计两个参数类的先验概率P Ci 和类条件概率密度p x Ci 对分类问题假设hi可直接视为类属性Ci 47 Bayesian学习参数估计的方法类的先验概率P Ci 的估计用训练数据中各类出现的频率估计依靠经验类条件概率密度p x Ci 估计的两种主要方法参数估计概率密度函数的形式已知而表征函数的参数未知通过训练数据来估计最大似然估计Bayes估计最大后验估计非参数估计密度函数的形式未知也不作假设利用训练数据直接对概率密度进行估计KN 近邻法Parzen窗法 48 简化模型简单贝叶斯Na veBayes 简单贝叶斯学习模型 NB 将训练实例表示成属性特征向量A和决策类别变量C 假定特征向量的各分量间相对于决策变量是相对独立的也就是说各分量独立地作用于决策变量降低了学习的复杂性在许多领域表现出相当的健壮性和高效性NB的特点结构简单只有两层结构推理复杂性与网络节点个数呈线性关系 49 NB用于分类 NB假设设样本A表示成属性向量如果属性ak对于给定的类别独立那么P A Ci 可以分解成几个分量的积简单贝叶斯分类 SBC SimpleBayesianClassifier 一般认为只有在独立性假定成立的时候 SBC才能获得精度最优的分类效率或者在属性相关性较小的情况下能获得近似最优的分类效果 50 扩展贝叶斯网 BayesNetwork P A P S P T A P L S P B S P C T L P D T L B P A S T L B C D 贝叶斯网络是表示变量间概率依赖关系的有向无环图 51 3 3基于实例的学习Instance based Bayeis方法的缺陷参数估计误差不描述概率分布而直接描述决策规则如最近邻规则直接从训练数据构造假设K近邻方法K NN最近邻方法NN K 1 52 K NN方法对输入样本x 从训练样本中找到与x距离最近的K个最近样本以它们最可能的类标签来分类x 53 K NN的性能亚优在训练样本足够的情况下错误概率小于最优错误率的两倍 Where istheprobabilityoferrorforBayesianinference Optimal andNNrule 不能在有限的样本下获得同样的断言 54 K NN的关键问题距离度量最常用方法 euclidean更好的距离度量 normalizeeachvariablebystandarddeviation离散数据 HammingdistanceK的选择Increasingkreducesvariance increasesbias高维空间的可区分性差Forhigh dimensionalspace problemthatthenearestneighbormaynotbeverycloseatall 大数据量时计算开销大Mustmakeapassthroughthedataforeachclassification Thiscanbeprohibitiveforlargedatasets Indexingthedatacanhelp forexampleKDtrees 55 EuclideanDistance EuclideanDistancebetweenxandpkis ThedecisionrulebasedonthismetriciscalledtheminimumEuclideanDistance MED classifier 56 MahalanobisDistance 用方差的倒数来进行加权相当于使决策界从方差较大的一方朝方差较小一方移动 Letthedistributionbeapproximatedbyamultivariatenormaldensity TheMahalanobisdistancefromxtomisgivenby Whereisthecovariancematrixandisthesamplemeanoftheprototype 57 人工神经元模拟生物神经元的一阶特性输入 X x1 x2 xn 联接权 W w1 w2 wn T网络输入 net xiwi向量形式 net XW激活函数 f网络输出 o f net 4 4神经网络 NN 模拟人脑的学习 58 典型网络结构简单单级网 59 典型网络结构单级横向反馈网 60 典型网络结构多级网 61 典型网络结构循环网 3 5支持向量机 SVM是一种基于统计学习理论的机器学习方法是由Boser Guyon Vapnik于1992年提出目前已经取得了广泛的成功应用统计学习理论的主要目标专门研究小样本下的机器学习规律追求现有信息条件下的最优结果结构风险最小化 62 Vapnik 63 结构风险最小化原则实际风险由两部分组成经验风险训练误差 VC置信范围 VCconfidence 学习机器的VC维及训练样本数有关 VC维反映了函数集的学习能力 VC维越大则学习机器越复杂容量越大结构风险最小化 SRM 的基本思想在有限训练样本下学习机器的VC维越高则置信范围越大真实风险与经验风险之间可能的差别越大这就是为什么会出现过学习现象的原因机器学习过程不但要使经验风险最小还要使VC维尽量小以缩小置信范围才能取得较小的实际风险即对未来样本有较好的推广性 64 结构风险最小化示意图 65 最优分类面最优分类面分类间隔 Margin 分类间隔最大实际上就是对推广能力的控制这是SVM的核心思想之一输入 S xi yi Rn 1 1 对应于yi xi可表示为两类 xi H1 yi 1xi H2 yi 1目标找到一个分类函数 x w x b能够对训练数据xi正确分类对其他的输入能够正确推广进一步说找到一个超平面H w x b 0和两个与H平行且等距离的H1 w x b 1H2 w x b 1 数学模型 66 最优分类面直观描述 a 小的分类间隔 smallmargin b 大的分类间隔 largermargin 最优分类面就是要求分类面能将两类正确分开训练错误率为0 且使分类间隔最大 67 支持向量直观地说支持向量是两类集合边界上的点所有非支持向量的数据都可以从训练数据集合中去掉而不影响问题解的结果对于新的数据点x 要对其进行分类只需要计算f x sign w x b 其中w 和b 是支持向量对应的参数 68 SVM的分类问题 SVM分类问题大致有三种线性可分问题近似线性可分问题线性不可分问题线性可分问题近似线性可分问题线性不可分问题 SVMLearning FindingtheDecisionBoundaryLet x1 xn beourdatasetandletyi 1 1 betheclasslabelofxiThedecisionboundaryshouldclassifyallpointscorrectly Thedecisionboundarycanbefoundbysolvingthefollowingconstrainedoptimizationproblem 69 TheDualProblem Itisknownasthedualproblem ifweknoww weknowallai ifweknowallai weknowwTheoriginalproblemisknownastheprimalproblemTheobjectivefunctionofthedualproblemneedstobemaximized Thedualproblemistherefore PropertiesofaiwhenweintroducetheLagrangemultipliers TheresultwhenwedifferentiatetheoriginalLagrangianw r t b 70 ExtensiontoNon linearDecisionBoundary Sofar wehaveonlyconsideredlarge marginclassifierwithalineardecisionboundaryHowtogeneralizeittobecomenonlinear Keyidea transformxitoahigherdimensionalspaceto makelifeeasier Inputspace thespacethepointxiarelocatedFeaturespace thespaceoff xi aftertransformationWhytransform Linearoperationinthefeaturespaceisequivalenttonon linearoperationininputspaceClassificationcanbecomeeasierwithapropertransformation IntheXORproblem forexample addinganewfeatureofx1x2maketheproblemlinearlyseparable 71 TransformingtheData ComputationinthefeaturespacecanbecostlybecauseitishighdimensionalThefeaturespaceistypicallyinfinite dimensional Thekerneltrickcomestorescue f Featurespace Inputspace Note featurespaceisofhigherdimensionthantheinputspaceinpractice 72 TheKernelTrick RecalltheSVMoptimizationproblemThedatapointsonlyappearasinnerproductAslongaswecancalculatetheinnerproductinthefeaturespace wedonotneedthemappingexplicitlyManycommongeometricoperations angles distances canbeexpressedbyinnerproductsDefinethekernelfunctionKby 73 ExamplesofKernelFunctions PolynomialkernelwithdegreedRadialbasisfunctionkernelwithwidthsCloselyrelatedtoradialbasisfunctionneuralnetworksThefeaturespaceisinfinite dimensionalSigmoidwithparameterkandqItdoesnotsatisfytheMercerconditiononallkandq 74 75 3 6聚类方法 K Means GivenasetofexamplesDn z1 z2 zn SearchforKprototypes kofdisjointsubsetsSkofDninordertominimizewhere kisthemeanoftheexamplesinsubsetSk Wecoulduseanydistance notjusttheEuclideandistance BatchK Means Initialization selectrandomlyKexampleszjinDnasinitialvaluesofeach kAteachbatchiteration Foreachprototype k putintheemptiedsetSktheexamplesofDnthatarecloserto kthantoanyother j k Re computethevalueofeach kastheaverageoftheexamplesinSk Thealgorithmstopswhennoprototypemovesanymore ItcanbeshownthattheK Meanscriterionwillneverincrease 76 BatchK Means 图示1 77 BatchK Means 图示2 78 BatchK Means 图示3 79 80 四机器学习的难题与挑战注以下部分内容引自周志华机器学习挑战王珏机器学习的难题与分析机器学习的难题 1 81 维数灾难问题 82 维数灾难问题 83 维数灾难问题 84 维数灾难问题 85 机器学习的难题 2 训练数据问题PU学习问题只有正例和未标记数据的学习问题从仅部分标记的正例和其它的未标记数据上学习最优分类器数据推广性 86 机器学习的难题 3 结构输出问题 87 挑战 1 泛化能力共性问题几乎所有的领域都希望越准越好提高泛化能力是永远的追求目前泛化能力最强的技术支持向量机 SVM 产生途径理论实践集成学习 ensemblelearning 产生途径实践理论挑战 1 泛化能力续第一个挑战今后10年能否更准如果能会从哪儿来挑战 2 速度共性问题几乎所有的领域都希望越快越好加快速度也是永远的追求训练速度 vs 测试速度训练速度快的往往测试速度慢 k近邻测试速度快的往往训练速度慢神经网络挑战 2 速度续第二个挑战今后10年能否更快能做到训练快测试也快吗如果能如何做挑战 3 可理解性共性问题绝大多数领域都希望有可理解性例子医疗诊断地震预测目前强大的技术几乎都是或基本上是黑盒子神经网络支持向量机集成学习黑盒子能满足需要吗挑战 3 可理解性续第三个挑战今后10年能否产生白盒子是和黑盒子完全不同的东西还是从黑盒子变出来挑战 4 数据利用能力传统的机器学习技术对有标记数据进行学习标记事件所对应的结果共性问题随着数据收集能力飞速提高 Internet的出现在大多数领域中都可以很容易地获得大量未标记数据例子医学图象分析垃圾邮件过滤没有标记的数据是没用的吗挑战 4 数据利用能力续共性问题在绝大多数领域中都会遇到坏数据有时甚至只有坏数据例子海军舰队Web 坏数据大量噪音属性缺失不一致传统的坏数据处理方式扔掉坏数据一点用也没有吗第四个挑战今后10年能否数据通吃如何吃挑战 4 数据利用能力续挑战 5 代价敏感目前的机器学习技术降低错误率错误是没有区别的吗把好当成坏把坏当成好共性问题大多数领域中的错误代价都不一样例子入侵检测癌症诊断一样吗第五个挑战今后10年能否趋利避害在达到较低的总错误率的基础上如何趋如何避挑战 5 代价敏感续挑战 More 在任何一个挑战上取得突破性进展都可能成为对机器学习的重要贡献 MagicofMachineLearning 100 MagicofMachineLearning 101 主流期刊和会议 Journals JournalofMachineLearningResearchMachineLearningIEEETransactionsonPatternAnalysisandMachineIntelligenceNeuralComputationIEEETransactionsonNeuralNetworksIEEETransactionsonKnowledgeandDataEngineeringConferences NIPS NeuralInformationProcessingSystemsCOLT ComputationalLearningTheoryICML InternationalConferenceonMachineLearningKDD KnowledgeDiscoveryandDataMininginDatabase 102 相关资料 Books C Bishop NeuralNetworksforPatternRecognition 1995 V Vapnik TheNatureofStatisticalLearningTheory 1995 T Hastie R Tibshirani J Friedman TheelementsofStatisticalLearning 2001 B Sch lkopf A J Smola LearningwithKernels 2002 103 104 附录典型机器学习包介绍典型的机器学习开发包 OpenCV MachineLearningLibrary介绍内容来自 OpenCV机器学习中文参考手册 Weka Machinelearning dataminingsoftwarewritteninJava介绍的PPT节选自E Frank MachineLearningwithWEKA SVM开发包LIBSVMSVM Light 105 OpenCVstructure CXCOREbasicstructuresandalgoritms XMLsupport drawingfunctions CVImageprocessingandvision HighGUIGUI ImageandVideoI O MLMachineLearningalgorithms CVCamvideostreamprocessing 106 OpenCV ML Overview 机器学习库 MLL 是一些用于分类回归和数据聚类的类和函数通用类和函数CvStatModelNormalBayes分类器CvNormalBayesClassifierK近邻算法CvKNearest支持向量机CvSVM决策树CvDTreeSplitBoostingCvBoostRandomTreesCvRTreesExpectation MaximizationCvEM神经网络CvANN MLP使用前添加ml lib及相应的头文件目录 107 CvStatModel ML库中的统计模型基类 classCvStatModel public virtual CvStatModel virtualvoidclear 0 virtualvoidsave constchar filename constchar name 0 0 virtualvoidload constchar filename constchar name 0 0 virtualvoidwrite CvFileStorage storage constchar name 0 virtualvoidread CvFileStorage storage CvFileNode node 0 108 NormalBayes分类器 CvNormalBayesClassifier 对正态分布的数据的贝叶斯分类器这个简单的分类器模型是建立在每一个类别的特征向量服从正态分布的基础上的因此整个分布函数被假设为一个高斯分布每一类别一组系数当给定了训练数据算法将会估计每一个类别的向量均值和方差矩阵然后根据这些进行预测 CvNormalBayesClassifier train模型训练CvNormalBayesClassifier predict对未知的样本或或本集进行预测 109 K近邻算法 CvKNearest这个算法首先贮藏所有的训练样本然后通过分析包括选举计算加权和等方式一个新样本周围K个最近邻以给出该样本的相应值这种方法有时候被称作基于样本的学习即为了预测我们对于给定的输入搜索最近的已知其相应的特征向量CvKNearest train训练KNN模型CvKNearest find nearest寻找输入向量的最近邻 110 支持向量机 CvSVMvirtualbooltrain constCvMat train data constCvMat responses constCvMat var idx 0 constCvMat sample idx 0 CvSVMParams params CvSVMParams virtualfloatpredict constCvMat sample const virtualintget support vector count const virtualconstfloat get support vector inti const CvSVMParams SVM训练参数struct 111 支持向量机 CvSVMParams SVM训练参数structsvm type SVM的类型 CvSVM C SVC n分类器允许用异常值惩罚因子CCvSVM NU SVC n类似然不完全分类的分类器 CvSVM ONE CLASS 单分类器CvSVM EPS SVR 回归异常值惩罚因子C被采用 CvSVM NU SVR 回归 nu代替了pkernel type 核类型 CvSVM LINEAR CvSVM POLY CvSVM CvSVM SIGMOIDC nu p 在一般的SVM优化求解时的参数 class weights 可选权重赋给指定的类别权重越大某一类别的误分类数据的惩罚项就越大 term crit SVM的迭代训练过程的中止 112 CvKNearest样例使用kNN进行2维样本集的分类样本集的分布为混合高斯分布

人人文库> 全部分类> 专业文献 > 金融证券

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计机器学习概论.ppt

文档简介

温馨提示

最新文档

评论

统计机器学习概论.ppt

文档简介

温馨提示

最新文档

评论

相关文档