淘宝数据库架构演进过程课件.ppt

上传人：优*** IP属地：广东上传时间：2020-01-29 格式：PPT 页数：43 大小：2.18MB 积分：35 举报 版权申诉

已阅读5页，还剩38页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

淘宝数据库架构演进过程丹臣赵林数据架构师提纲淘宝数据库发展的三个阶段用户商品交易现在的架构2010双11大促的挑战MySQL源代码研究的一些思路淘宝自主数据库Oceanbase原理介绍淘宝的数据很美丽淘宝数据库发展三阶段 SQL语句变化多表关联Join 单表复杂查询主键查询 SQL语句复杂程度由繁到简的过程折射出淘宝数据架构的一些变化淘宝电子商务网站的特点高并发 PV13亿光棍节促销PV达到了17亿数据实时性要求高数据准确性要求高大多数页面属于动态网页网站需要大量商品图片展示用户通过搜索引擎广告类目导航寻找商品网站读多写少比例超过10 1卖家相关的数据量较大比如商品数评价数业务量快速增长不同的时期不同的策略正是因为如上的业务特点早期的淘宝前端应用系统严重依赖于数据库系统早期单机式的mysql的使用方式在业务的高速发展下很快达到瓶颈Mysql迁移到Oracle 并升级到小型机高端存储后几年的时间里满足了淘宝业务快速变化发展的需要我们的业务发展很快但我们的技术没有成长数据库里的数据第一二阶段的单台数据库里用户商品交易等数据都在一起存在许多的关联查询应用完全耦合用户商品交易评价收藏连接数问题 Oracle数据库太多的应用机器有限的链接池需要数据库连接小型机的内存有限发现了Oracle数据库有连接数瓶颈 5000个以后相当吃力中心化服务化用户商品交易三大中心的建设 HSF的诞生中心化后面临另一个问题服务调用者与服务者之间如何进行远程通信淘宝HSF诞生数据库一些OLTPjoin问题解决 A服务 B服务 HSF 数据垂直化应用中心化之后底层数据库系统按照不同的业务数据进行了一系列的垂直拆分此类拆分方式具有如下的特点 a 拆分方式简单只需要把不同的业务数据进行分离b 避免了不同的业务数据读写操作时的相互影响c 该业务内部及其所导致的问题依旧用户商品交易评价问题单库IOPS3w单库连接数已经4k个了应用还在不断加机器单库每秒SQL执行次数到4w次搜索dump数据缓慢 DWETL缓慢用硬盘来拼IOPS 一台高端存储的处理能力 480块盘的hdisk maxIOPS6w注意应用可以接受的IOresponsetime 以及IOPS点比如3wIOPS以上会达到20ms以上数据库架构发展新思路异构数据库读写分离原始架构图 08年8月份异构的读写分离 a 写库为集中式的oracle环境提供数据安全性保障b 读库使用mysql 采用数据分片分库分表每台mysql放少量的数据单个数据分片内部采用mysql复制机制c 读库的超大memory容量起到了很好的cache作用在内存中的数据查询性能远远高于在硬盘上的性能d oracle到多台mysql按规则复制由TDDL完成e 分区键的选择至关重要尽量让数据访问落在单台数据库上g 利用好当前的高端硬件保护好自己的投资构建数据查询的高速公路应用到DB的数据写入与查询从双向通行变成了单向通行通行效率更高大大避免了相互影响借道行驶的情况不再出现跨不过去的坎为什么不直接迁到MySQL上面去呢 a 对于核心业务停机时间有限宠大的数据无法短时间内迁移b 无法在短时间内完成项目发布过程中的测试c 没有搞过mysql分布式系统对完全使用MySQL还没有信心大数据量核心业务数据迁移思路采用两步走战略不仅走得稳而且走得好先采用异构的数据库读写分离将数据复制到目标mysql各结点不断切换应用相关的读服务到mysql结点上验证可靠性机器压力服务响应时间将写压力从oracle结点迁移到mysql各结点 oracle停止写对于一些不太核心业务不太复杂相关影响点不多的数据可以直接进行迁移水库模型你的系统可以撑多少系统余量还有多少数据库系统余量两轮测试过程确保上线稳定底层数据库环境性能稳定性的基础测试常用的工具可以采用sysbench orion supersmack选择不同的硬件软件组合模拟应用的压力测试要超越当前业务压力的几倍进行这个压力的幅度可以根据自己的业务增长设计一个合理的值我们如何做到用数据来说话靠测试拿数据不靠经验 2020 1 29 22 可编辑数据库系统余量数据生命周期之历史迁移 Data OnlineData HistoryData 商品交易评价物流等数据都有自己的生命周期通过数据历史迁移减少在线库的容量提高在线库的性能在线与历史应用分离 OnlineDataDatabase HistoryDataDatabase OnlineApplication HistoryApplication 数据迁移程序在线库与历史库重要等到级不同在线库更高同一应用的在线应用与历史应用分离高级别的应用不能直接依赖于低级别的数据库商品访问框架主键查询卖家查询淘宝商品的几个主要的查询 a 主键查询通过分布式数据库以及分布式缓存系统解决b 卖家商品管理类查询这一类的查询数据量大并且还有like查询的需求通过实时搜索解决商品分布式缓存分布式数据库实时搜索注考虑不同的读载体的技术实现性能成本用户用户登陆事件数据日志量90 与用户主数据日志量10 分离不仅要分表而且要放到不同的数据库集群中并且作好不同数据等级的容灾处理用户信息用户主信息用户信息扩展用户主信息数据库集群用户信息扩展数据库集群过度中心化用户中心 Tair分布式缓存商品中心交易中心评价中心用户中心调用次数高峰时期达到了每天60亿次用户中心的过度中心化问题越来越显著成为各种操作的关键路径 Mysql集群用户中心中的读写分离用户中心 Tair分布式缓存商品中心交易中心评价中心 Mysql集群在其它中心中内置可以访问tair的客户端大部份的读不需要经过用户中心直接读tair 写需要经过用户中心交易的读写分离框架主库按照买家拆分读库按照卖家拆分一些难题数据库集群自动扩展仍然是个难题但是是可以忍受的底层数据库集群经过评估扩展的频率并不高 MySQLDDL操作不便锁表对写操作影响较大为了减少影响分了比较多的表进一步加重了维护的负担其它光棍节大促活动前经过了充分的准备与系统评估工作 CDN面临的压力最大预估流量将会达到280G左右准备了各个层面的系统降级方案一个小意外 Dataguard mirrorredo对写的影响比较大临时删除远程的redomember解决这个问题 MySQL源代码研究我们主要从两方面着手 MySQL内部源代码熟悉性能优化新增功能MySQL外部比如利用binlog做数据复制 MySQL源代码研究内部新增的一些功能 a 给innodb动态加数据文件b 禁止新连接c 表的访问统计d Innodbssd加速e Mysqlreplication并行复制 MySQLBinlog解析数据复制中心解决商品用户评价收藏夹等应用向数据仓库搜索增量同步数据的需求 MySQLBinlog解析数据复制中心 Cclient端特性 a 支持mysqlmaster slave主备切换获取binlog不受影响b 自动重连主机c 支持checkpoint 支持断点续传binlogJava端复制代码特性 a 支持statement row两种复制模式b 支持按规则复制c 支持一定条件下的并行复制c 支持checkpoint 异地多数据中心的数据同步杭州青岛 other 异地多数据中心的数据同步除了oracledataguard master slavereplication数据复制我们还有其它哪些可选方案淘宝自主数据库Oceanbase 动态数据与静态数据进行分离动态数据采用集中式静态数据存放与服务采用分布式设计了一个宽表冗余

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

淘宝数据库架构演进过程课件.ppt

文档简介

温馨提示

最新文档

评论

淘宝数据库架构演进过程课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档