网络分布式系统设计02.pdf

上传人：s*** IP属地：河南上传时间：2020-01-20 格式：PDF 页数：23 大小：626.46KB 积分：20 举报 版权申诉

已阅读5页，还剩18页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

下载第2章分布式程序设计语言在这一章里我们概述通用分布式程序设计语言并介绍类 C S P分布式控制描述语言 D C D L 这种语言用于描述一些控制结构如并行的表示进程间通信和同步容错设计用 D C D L表示的控制算法在抽象层上提出可以应用于操作系统层语言运行时系统层或用户层 2 1 分布式程序设计支持的需求显然传统的顺序程序设计语言如 F o r t r a n P a s c a l和C不适合于分布式系统这些语言不能解决诸如并发通信同步和可靠性的问题基本上可在三个方面区分分布式程序设计和顺序程序设计 7 多个P E的使用 PE之间的合作对局部故障的生存能力多个P E的使用是和并行的表示相联系的 P E之间的合作包括两种类型的交互通信和同步通信一般包括两个或更多收发消息的进程同步可能由于竞争 c o m p e t i t i o n 或条件 c o n d i t i o n 当几个进程试图访问系统中有限资源时就发生了竞争这个问题称做互斥第 4章将做详细讨论由条件产生的同步发生在当一个进程在下述意义上依赖于其他进程时它的进度可能被阻塞直到系统状态的某个条件变为真虽然分布式系统具有对部分故障的存活潜力用户或系统设计者还是要负责把这种潜力转化为现实注意上述问题可以在以下某一层次上得以解决 a 用户层 b 语言运行时层 c 操作系统层我们不考虑不同层次上这些问题的实现细节而是着重于独立于层次的抽象解决方案用于提供抽象解决方案的语言是 D C D L 它是一种框架控制驱动语言 skeleton control driven language 与模式驱动语言 P R O L O G 数据驱动语言 VA L 或需求驱动语言 F P 相比 D C D L类似于通信顺序进程 communicating sequential processes C S P 2 7 另一种分类法把程序设计语言分为命令型和应用型 D C D L是一种面向语句和顺序的命令型语言应用型语言通过功能应用和绑定来表示程序一种程序设计语言通过它的语法和语义来定义语法定义了程序中的合法的符号串语义定义了每个语法结构的意义或相对于每个语法结构所要采取的动作类型 D C D L将用于描述任意层次上的算法附录给出了 D C D L中常用的符号列表 D C D L中每个结构的意义不通过形式语义模型如操作型公理型和指称型语义来描述而是通过后面几节中的实例来描述 2 2 并行分布式程序设计语言概述我们要把分布式程序设计语言和并行程序设计语言区分开来分布式程序设计语言必须考虑通信的开销而并行程序设计语言通常工作在共享存储器上这一章我们只讨论分布式程序设计语言而不涉及主要针对并行计算的并行程序设计语言在并行程序设计语言中信号量和管程主要用于同步对共享存储器的协同多路访问一个信号量 1 8 是一个非负整型变量在它上面定义了两种操作 P操作等待和V操作发信号对共享存储器的每次访问都必须在一个 P操作之后和一个 V操作之前管程 2 5 定义了一套资源和管理这些资源的操作资源只能通过管程自身定义的操作来访问在分布式程序设计语言中语言本身就使得问题的分解变得和通信细节一样明显其中 C S P 2 7 对其他面向消息传递系统的程序语言的设计有重大的影响一些程序设计语言介于以上两种模型之间比如协同式语言中问题的分解是显式的但一些通信细节被隐藏起来了最好的例子是 L i n d a 1 5 它通过提供元组空间 tuple space 的抽象去耦 d e c o u p l e 通信中的接发双方通过访问元组空间可以得到其他线程事先放在其中的值发送方线程无需知道接收方线程甚至无需知道接收方线程是否存在通过引入更高层的抽象页面空间以上概念已经被扩展到W W W的框架 1 7 S k i l l i c o r n和Ta l i a 4 3 给出了并行模型的分类允许编写任意计算的任意计算结构 a r b i t r a r y computation structures 和限制计算的形式从而限制通信量和通信类型的限制计算结构 restricted computation structures 在限制计算结构中数据并行程序设计语言由于它们在为高性能计算和通信 H P C C 应用所进行的数值计算中的广泛应用而得到重视它们中的大部分是流行的C C 和F o r t r a n的扩展例如在欧洲欧洲联盟 Europe Consortium 基于主动对象 active object 定义了并行C 在日本建立了M P C 程序 2 9 来为C 编译器的用户层扩展提供强大的机制在美国 H P C 联盟正在开发H P C 8 作为可移植并行C 的标准模型它是一个C 库和语言扩展框架在 F o r t r a n的修订版本中 Fortran 77和Fortran 90 1 已成为A N S I标准而高性能F o r t r a n论坛 H P F 3 8 正在开发一种事实上的标准有一些分布式程序设计的标准如 M P I 消息传递接口 3 9 和P V M 并行虚拟机 2 4 P V M 是分布式计算的事实标准 M P I被认为是未来的消息传递标准一般认为 M P I在大型系统中的速度更快它比P V M有更多的点到点通信和组通信的可选项如果算法依赖于某个特别的通信可选项的话这一点就显得很重要当应用运行在异型网络上时 P V M则表现得更好它具有不同主机间的良好的互操作性 P V M支持容错应用的开发容错应用在主机或任务出现故障时能继续工作由于P V M模型是建立在虚拟机的概念上它提供了一套强大的动态资源管理和进程控制功能并行分布式程序设计的工具正在成熟这些工具包括 a 代码并行化辅助工具 b 创建程序的G U I 图形用户接口 c 跟踪任意进程或线程状态的调试器 2 3 并行性的表示并行性的表示有几种方法一个重要的因素是并行性单元一个并行性单元可以是一个进程一个对象在面向对象程序设计中一个语句一个子句 c a u s e 在逻辑程序设计中第2章认分布式程序设计语言部分21 下载 22部分分布式系统设计下载表2 1 四种基本的顺序控制机制和相应的并行机制控制类型顺序控制并行控制语句类型顺序并行语句b e g i n S1 S2e n dparbegin S1 S2parend f o r k j o i n 选择语句goto caseguarded commands i f C then S1else S2G C 重复语句for d odoall for all 子程序Procedure subroutineprocedure subroutine 表2 1表示四种顺序控制机制和相应的并行机制并行语句可以用优先图来表示节点代表语句有向边代表优先关系优先图是有向无环图 D A G 也就是说它是不带环路的有向图图 2 1表示了八个语句的优先图注意在优先图中不存在冗余的连接优先顺序如果一个优先顺序可以从其他优先顺序导出它就是冗余的例如在图2 1中从S1到S4的连接是冗余的因为它可以从 S1到 S2的连接和S2到S4的连接导出也就是说优先顺序是传递的一个优先顺序集合 R是非冗余的当且仅当不存在R的子集使得它们有相同的传递闭包直观上当 R不能进一步缩减时它就是非冗余的在D C D L中一个并行语句表示为 S1 S2 Sn 代表语句S1 S2 S n是并行执行的在许多并行分布式语言中这种结构也表示为 p a r b e g i n和p a re n d 或 c o b e g i n和c o e n d Si 1 i n 可以是一个命令列表C 或一个D i j k s t r a保护命令 guarded command 1 9 G C 其中 G是一个由布尔表达式列表组成的保护 g u a r d C是一个命令列表一个被保护的命令当它的保护执行成功时它可以被执行在 D C D L中顺序语句S1 S2 Sn表示为 S1 S2 Sn 在D C D L中图2 1中的优先图可以表示为 S1 S2 S3 S4 S5 S6 S7 S8 不是所有的优先图都能用 D C D L语句表示比如图 2 2 这个问题有三种可能的解决方法一个简单的解决方法是把给定的优先图转换为一个更具限制性的优先图使得它可以用 D C D L提供的并行和顺序语句来表示如果优先图 G 的所有优先顺序可以从G的优先顺序导出则优先图 G比G 更具有限制性在图 2 2中如果我们用从 S3到S2的连接取代从S3到S5的连接我们就可以如下表示新的图图2 1 八个语句的优先图 S1 S3 S2 S4 S5 S6 注意从S3到S5的连接可以用从S3到S2的连接和从S2到S5的连接导出新图是原图的限制性版本自然从S1到S2的连接就成了冗余的了限制性图可能会失去一定程度的并行性第二种解决方法使用了一种更有效的结构 f o r k j o i n 实际上任何优先图都可以用 f o r k j o i n语句表示 fork L 指令在一个程序中产生两个或更多的并发执行一个执行从标有L的语句开始其他则接着 f o r k指令继续当前的执行线程 j o i n指令有一个参数用于指出要结合 j o i n 的线程数除最后一个线程外的所有线程在到达 j o i n语句时退出对于图2 2中的优先图其相应的使用f o r k和 j o i n 语句的程序如下 s1 c1 2 fork L1 s2 c2 2 fork L2 s4 go to L3 L1 s3 L2 j o i n c1 s5 L3 j o i n c2 s6 注意以上解决方法中每个计数器如 c1和c2 的初始化可以放在相应的结合语句执行前的任何地方当需要产生几个线程时可以使用 f o r k L1 L2 L n 来产生n个新的线程这种结构和n个顺序语句等价 f o r k Li 其中1 i n 第三种解决方法使用了 p a r b e g i n p a r e n d语句和信号量这种结合与 f o r k j o i n语句有同样的表示能力信号量可用于管理一组资源更正式地讲信号量是一个具有两个操作 P操作和V 操作的对象 P操作得到与信号量相关联的资源的一个拷贝而 V操作则释放该资源的一个拷贝如果信号量忙也就是说它已经用完资源的拷贝那么请求进程发出 P操作的进程将被中断直到资源被释放当另一个进程对信号量执行 V操作时被中断的进程将被释放并允许访问第2章认分布式程序设计语言部分23 下载图2 2 不能用DCDL语句表示的优先图原文为V 译者注资源信号量s的一种典型实现是使用一个非负整数 V s 操作对s加一 P s 对s减一如果s是正数这个操作成功如果它是零那么执行 P操作的进程将被中断直到信号量变为正数二元信号量s是一种特殊的信号量其中s只能是0或1 为了表示优先图将使用多个二元信号量优先图中的每条连接一个对于两个语句 Si和Sj 并且Sj直接跟在Si后面将使用信号量 si j Si完成时将对si j发出V操作类似地 Sj执行前将对si j发出P操作信号量可以被认为是一个锁一个语句只有当它通过 P操作从所有它前面的语句获得许可时才能开始执行当一个语句结束时它必须把许可授予它的所有直接后继也就是说通过相应信号量上的V操作把锁的钥匙授予其每个后继根据以上修改每个语句 Si变为 S i 一系列P操作 Si 一系列V操作然后所有这些S i 通过一个没有任何进一步限制的并行语句连接实际上所有优先关系的限制通过定义在每个S i 中的信号量得以实现图2 2优先图中的每个节点可以表示为 S 1 S1 V s1 2 V s1 3 S 2 P s1 2 S2 V s2 4 V s2 5 S 3 P s1 3 S3 V s3 5 S 4 P s2 4 S4 V s4 6 S 5 P s2 5 P s3 5 S5 V s5 6 S 6 P s4 6 P s5 6 S6 所以该优先图的程序如下所有二元信号量初始化为零 S i 1 6 S i 1 6 代表六个顺序语句S i 1 i 6 的并发语句并行进程的执行也可以用类似的方法表示 P1 P2 Pn 其中 P1 P2 Pn是每个进程的名字每个进程在别处定义所以 D C D L可以在进程级和语句级描述并行性假设每个进程由几个顺序语句组成这些进程的并行执行产生了这些进程中的所有语句的排列只要这种排列保持语句在其原来进程中的顺序例如对于P1 p1 1 p1 2 和P2 p2 1 p2 2 p2 3 语句 P1 P2 产生以下排列之一 p1 1 p1 2 p2 1 p2 2 p2 3 p1 1 p2 1 p1 2 p2 2 p2 3 p1 1 p2 1 p2 2 p1 2 p2 3 p1 1 p2 1 p2 2 p2 3 p1 2 p2 1 p1 1 p1 2 p2 2 p2 3 p2 1 p1 1 p2 2 p1 2 p2 3 24部分分布式系统设计下载 p2 1 p1 1 p2 2 p2 3 p1 2 p2 1 p2 2 p1 1 p1 2 p2 3 p2 1 p2 2 p1 1 p2 3 p1 2 p2 1 p2 2 p2 3 p1 1 p1 2 一个选择语句表示为 G1 C1 G2 C2 Gn Cn 选择语句选择其组成的被保护的命令之一执行如果多于一个命令可被选择选择将是不确定的 1 3 2 1 实例2 1 x y m x y x m y 如果x y 将x赋予m 如果y x 将y赋予m 如果x y并且y x 将x或y之一赋予m 一个重复语句指定其组成选择语句的交互次数这些语句带保护或不带保护它的形式如下带保护的选择语句当所有的保护都经过时重复语句终止即不带保护的选择语句后者的执行不终止我们如何表示要终止执行的传统程序呢我们用的方法是区别程序的执行正执行语句的无限序列和程序的实现正执行语句的无限序列的有限前部程序的某个状态称为固定点当且仅当在这个状态下程序中任何语句的执行都不改变程序的状态程序在固定点时的结果就是相应程序的结果 n 选择语句是一个特别的重复语句其重复的次数最多为 n 注意当语句中的所有保护如果存在失败时这个语句仍然可能在重复执行其选择语句 n次前终止实例2 2约会时间问题 1 6 这个问题是为三个参与者 A B C安排合适的约会时间初始时建议的约会时间t为零如果一个参与者不能在该时间赴约他或她就分别通过 a b c把建议的约会时间值t增加为下一个可能的时间在固定点 r将是一个公共的约会时间约会时间调度 t 0 t a t r b t r c t 符号代表一个函数或过程的定义在这个程序中不确定地选择执行其中任何一个赋值使计算继续下去选择也必须遵守公平规则每个赋值被无限次执行例如假设以上例子被执行无限次如果 A在每6k 6k 3 6k 4步被选中执行 B在每6k 2 6k 5步被选中执行 C在每6k 1步被选中执行虽然A B C被选中的概率不同我们说这种选择仍是公平的公平性在分布式系统中是一个独特而复杂的问题详细的讨论见 2 2 选择语句和重复语句可以结合使用来解决更加复杂的问题实例2 3给出一个确定的数组b 1 m 1 n 其中1 m 1n i i 1 j 1 在计算表达式x y时如果x为假我们就可以不计算 y而节省时间因为不论 y为何值表达式总是为假这种优化称之为短路实例2 4R u b i n问题 2 0 确定一个m n的矩阵a 1 m 1 n 中某一行的所有元素是否全部为零这是一个2维的查找问题这个问题被R u b i n提出来作为一个用 g o t o 语句最容易解决的例子困难集中在如何终止嵌套循环的问题上下面的方法说明不用 g o t o语句的简单方法也是可行的 i 1 p m 1 i p j 1 q n 1 j q a i j 0 j j 1 a i j 0 q j j n p i j n i i 1 f o u n d i m 1 上述算法生成一个布尔变量f o u n d 如果f o u n d T 则存在这样的全零行否则不存在当两个语句并发执行时可能产生与顺序执行不同的结果让我们先定义以下符号 R Si Si的读集即值在Si中被引用的所有变量的集合 W Si Si的写集即值在Si中被改变的所有变量的集合 B e r n s t e i n 9 提出了以下三个条件对于两个并发执行的语句 S1和S2 必须满足这三个条件才能使其结果与它们以任意次序顺序执行时的结果相同 1 R S1 W S2 2 W S1 R S2 3 W S1 W S2 我们使用S1 S2表示语句S1和S2满足这三个条件可以并行执行实例2 5假设S1 a x y S2 b x z 则这两个语句可以并发执行因为 26部分分布式系统设计下载第2章认分布式程序设计语言部分27 下载 R S1 x y R S2 x z W S1 a W S2 b 然而 S2不能和S3 x z 1并发执行因为 R S2 W S3 x 以上条件也称为B e r n s t e i n条件一般一个语句集Si 1 i n 如果两两满足B e r n s t e i n条件那么可以并行执行即 S1 S2 Sn i jSi Sj 我们还可以利用B e r n s t e i n条件来寻找语句中可以并行执行的最大子集为此我们定义了一个无向图节点集由给定的语句集组成如果 Si Sj 则节点Si和Sj相连最大的语句子集对应于最大的完全子图实例2 6假设S1 a x y S2 b x z S3 x y z S4 c y 1 利用B e r n s t e i n条件我们有S1 S2 S1 S3 S1 S4 S2 S4 相应的图表示在图2 3中显然 S1 S2 S3形成最大的完全子图也就是说 S1 S2 S3 图2 3 Bernstein条件的图模型 2 4 进程通信与同步分布式系统设计的一个重要问题就是如何让一个程序在不同 P E上并行运行的各部分协同工作这种协同包括两种类型的交互通信和同步原则上分布式系统中存在两种互补的通信方式消息传递允许进程交换消息进程间的通信手段基本上提供了两种抽象的操作发送消息和接收消息共享数据在没有共享存储器的分布式系统中为通信提供共享数据在 L i n d a中使用的被称为元组空间 1 5 的分布式数据结构的概念是提供共享数据的一种方法使用共享数据的关键问题在于防止多个进程同时修改数据注意在共享存储器系统中的机制如管程和信号量不能被用在这里消息传递方式的实现一般要求对以下几点做出决策一对一还是一对多同步的还是异步的单向通信还是双向通信直接通信还是间接通信自动缓冲还是显式缓冲隐式接收还是显式接收一对一消息传递也称为点到点消息传递而一对多消息传递支持高效的广播和组播方式 3 4 在同步消息传递时发送方被阻塞直到接收方收到消息在异步消息传递中发送方不等待接收方单向通信体现了发送方和接收方间的一方面的交互而双向通信则意味着发送方和接收方间的多方面的交互包括后向的和前向的直接通信和间接通信的区别在于发送方消息是直接还是间接发送给接收方间接发送通过一个中间对象通常称为邮箱或端口邮箱支持多个发送方和接收方共享同一个存储单元端口是一种特殊的邮箱通常隶属于发送方或接收方当端口隶属于发送方时它支持一个发送方和多个接收方当端口隶属于接收方时它支持多个发送方和一个接收方通常端口是一个由内核维护的有限的先进先出 F I F O 队列在许多情况下端口和邮箱可以互换使用在通信方式中如果发送方和接收方互相指定对方则这种通信方式是对称的如果只有发送方指定接收方则这种通信方式是不对称的显式缓冲要求发送方说明接收方用于容纳消息的缓冲区的大小以便确知消息来源发送方而隐式接收不考虑消息的来源有五种常用的消息传递模型 7 同步点对点异步点对点会合远程过程调用和一对多同步点对点方式被O c c a m程序设计语言 1 4 所采用它使用了发送方和接收方间的单向通信利用发送和接收原语编写程序相对困难因为程序员必须考虑许多细节如请求消息和响应的一一对应数据的表示了解远程处理机或服务器的地址考虑通信故障和系统故障两种常用的更高层的通信结构是会合用于 A d a 和远程过程调用 R P C 用于D P 2 6 R P C使用双向通信类似于客户服务器模型在客户服务器模型中客户请求服务并等待服务器的结果这两种方法的不同点在于在R P C中调用者或发送方被阻塞而在会合中不被阻塞对 R P C的详细研究将在下一节讨论一对多的消息传递不常用虽然有些语言如广播顺序进程 B S P 2 3 使用这种方式到目前为止讨论的问题都是逻辑上的或是在应用软件层上的作为基础的硬件层和网络层存在更多的实现方面的问题这些问题包括 4 0 如何建立通信链接一个通信链接能否同两个以上的进程联系在每一对进程间该有多少链接一个链接的通信能力如何消息的大小如何定长还是变长链接是单向还是双向的这些问题的详细讨论超出了本书的范围接下来我们将集中讨论 D C D L提供的用于进程通信和同步的命令在D C D L中采用了异步点到点消息传递消息通过异步静态通道链路传递给指定的接收方进程一个输出命令的形式如下 send 消息列表 t o 目的地其中目的地是一个进程名一对一通信或代表所有其他进程一对全通信的关键字a l l 28部分分布式系统设计下载一个输入命令有如下形式 re c e i v e 消息列表 f ro m 信源其中信源是一个进程名可选这个输入命令支持显式和隐式的消息接收隐式的消息接收表示为 re c e i v e 消息列表异步静态通道链路是两个进程间的一个 F I F O队列除非另外说明否则我们假设任意两个进程间只有一个通道注意同步通信可以通过异步通信来模拟在发送方我们有 s e n d 消息列表 t o 目的地 receive 空信号 f ro m 目的地在接收方我们有 re c e i v e 消息列表 f ro m 发送方 s e n d空信号 t o 发送方以上结构可以扩展以实现屏蔽同步用多种迭代算法依次计算解的更好逼近值直至得出最后解或者迭代已经收敛每次迭代依赖于上一次的结果注意带真保护的迭代对应于一个周期性的进程 true 实现进程Pi的代码等待所有的n个进程完成在上述算法中 t ru e是一个布尔常量它总是返回真值也就是说条件总是满足这种类型的同步称为屏蔽同步 3 1 每次迭代结束时的延迟点体现了屏蔽所有进程到达这个点后才允许任意一个进程通过在非对称实现中有一个进程被称为协调者其余的是工作者当协调者收到每个工作者的消息时给所有的工作者发一个特别的信号工作者 i t ru e 实现进程Pi的代码 s e n d s i g n a l t o 协调者 re c e i v e a c k f ro m 协调者协调者 t ru e c o u n t e r 0 c o u n t e r n 第2章认分布式程序设计语言部分29 下载 re c e i v e d s i g n a l counter c o u n t e r 1 s e n d a c k to all 要构造一个对称的屏蔽每个进程中代码相同的屏蔽我们可以利用两个进程的屏蔽作为构件假设b a rr i e r Pi Pj 是进程Pi和Pj之间的屏蔽同步如上面的实例之一对于八个进程的屏蔽如下阶段1 b a rr i e r P1 P2 b a rr i e r P3 P4 b a rr i e r P5 P6 b a rr i e r P7 P8 阶段2 b a rr i e r P1 P3 b a rr i e r P2 P4 b a rr i e r P5 P7 b a rr i e r P6 P8 阶段3 b a rr i e r P1 P5 b a rr i e r P2 P6 b a rr i e r P3 P7 b a rr i e r P4 P8 它的图示如图2 4 下面的例子给出了更多D C D L中发送和接收命令的使用图2 4 三阶段对称屏蔽实例2 7s q u a s h 2 7 s q u a s h程序用一个上箭头代替每一对连续的星号假设输入的最后一个字符不是星号 squash re c e i v e c f rom input c s e n d c t o o u t p u t c receive c f rom i n p u t c s e n d t o o u t p u t s e n d t o output c s e n d t o o u t p u t 30部分分布式系统设计下载阶段1 阶段2 阶段3 i n p u t 输入进程是一个重复命令 input s e n d c t o squash o u t p u t 输出进程是另一个重复命令 output re c e i v e c f rom squash 在一个重复命令中使用接收命令作为保护时保护的执行将被延迟直到相应的发送命令被执行一个保护中有接收命令的命令只有在相应的发送方终止时才终止实例2 8我们可以用如下递归的方法计算f n f n 1 n2 n 1并且f 1 1 p i 1 n receive m f rom p i 1 m 1 s e n d 1 t o p i 1 m 1 s e n d m 1 t o p i 1 re c e i v e r f rom p i 1 send m m r t o p i 1 p 0 s e n d n t o p 1 re c e i v e result f rom p 1 f n 的解法是所有n 1个进程的并行执行 p i 0 n 在上述解法中 n 1个进程用于解决该问题见图 2 5 这种方法只能用于举例说明进程间通信的使用绝非一个有效的方法 p 0 是一个用户程序把n送给p 1 并从p 1 接收结果f n 每个p i 计算f n i 1 1 i n 活动的p i 数取决于n 图2 5 实例2 8的递归解法一种方法可以只使用一个进程解决这个问题 f n 的定义可以容易地转化为一个递归过程来计算f n 第2章认分布式程序设计语言部分31 下载结果 32部分分布式系统设计下载 p n a n s ans 1 n 0 skip n 0 p n 1 a n s a n s a n s n n 在以上解法中 f n 的结果存放在变量 a n s中递归对于导出问题的简单解法特别有用同时至少在理论上任何递归程序都可以用迭代的形式编写反之亦然实际上这样做可能更有意义也许是空间和时间效率的问题推动了迭代的使用 f n i n a n s 1 i 1 ans a n s i i i i 1 实例2 9D C D L也可用于实现一个二元信号量s Semaphore s v a l 0 receive V f rom p roc i val v a l 1 val 0 receive P f rom p roc i v a l v a l 1 其中 p ro c i 是向信号量s请求P或V操作的进程对于某些其他问题还存在几个解决不同进程间的通信结构的方法实例2 1 0F i b o n a c c i数列是由递推公式F i F i 1 F i 2 i 1 定义的一列整数其初始值F 0 0 F 1 2 我们提供一个F i 的D C D L实现每个F i 一个进程我们再一次定义一系列进程 f i 用于计算F n i 1 显然如果n i 1 1 f i 取决于f i 1 和f i 2 的计算结果一个自然的解法就是如果 n i 1 大于1 f i 从f i 1 接收 n i 1 并把 n i 传递给f i 1 然后f i 等待f i 1 和f i 2 的结果把它们相加并把相加的结果传递给f i 1 和f i 2 见图2 6 图2 6 F n 的解法 f 0 s e n d n to f 1 receive p f rom f 2 receive q f rom f 1 ans q f i receive n f ro m f i 1 n 1 s e n d n 1 to f i 1 receive p f rom f i 2 receive q f rom f i 1 send p q to f i 1 send p q to f i 2 n 1 send 1 to f i 1 send 1 to f i 2 n 0 send 0 t o f i 1 send 0 t o f i 2 f 1 receive p f rom f 1 在上述算法中 f 0 是U S E R f 1 是虚进程如果我们把f i 中的语句send p qt o f i 2 改成 i 1 s e n d p q to f i 2 则f 1 可以删去第二个解法使通信只局限于邻居之间即 f i 只能和f i 1 和f i 1 通信见图2 7 图2 7 F n 的另一种解法 f 0 n 1 s e n d n t o f 1 receive p f rom f 1 receive q f rom f 1 ans p n 1 ans 1 n 0 ans 0 f i re c e i v e n f rom f i 1 n 1 send n 1 t o f i 1 receive p f ro m f i 1 receive q f rom f i 1 第2章认分布式程序设计语言部分33 下载 send p q to f i 1 send p to f i 1 n 1 send 1 to f i 1 send 0 to f i 1 2 5 远程过程调用分布式系统的基本通信范例是输入和输出上一节讨论的 s e n d和re c e i v e命令然而有些程序员更喜欢集中式系统中没有显式通信原语的编程风格所以引入了远程过程调用 R P C 1 2 它具有发送和接收命令的功能但看起来很像一个本地过程调用 R P C的一般实现如下当一个程序需要从一个文件中读取数据而该读操作是一个远程过程时一个客户桩模块 client stub 被置入库中在读操作调用之后客户桩模块把调用参数包装在一个消息中并调用远端的服务器桩模块 server stub 接着阻塞自身直到响应到达当消息到达服务器时服务器桩模块解开消息并调用服务器过程仿佛它是被客户直接调用似的服务器执行被请求的工作并把结果返回给调用者服务器桩模块调用完成后服务器桩模块重新得到控制并把结果包装后返回给客户当消息到达客户时由内核把消息拷贝到等待缓冲区并激活客户进程客户桩模块解开结果并把它拷贝给它的调用者当调用者得到控制时它所知道的只是它所要求的数据已经得到了至于是在本地还是在远端做的工作它一无所知然而基本的R P C有以下一些缺陷通信开销当客户用同样的数据调用几个过程时每次调用都要传送一次该数据因为 R P C不支持远程对象在嵌套过程调用时每次中间调用的结果都必须被传回给客户再发送给服务器缺乏并行性 R P C的语义很简单但它的执行是顺序的调用者被挂起直到获得结果缺乏灵活性一个R P C的客户只能使用有限的几种服务每个新的过程都必须由有经验的程序员准备并安装好有很多对基本R P C的扩展然而许多扩展 R P C为了包含并行特性 5 导致复杂的语义结果反而失去了R P C的主要优点 L i s k o v和S h r i r a 3 6 提出的异步R P C已成功地在M I T的M e r c u r y通信系统上实现 B e r s h a d 1 0 提出的轻量级R P C通过利用线程的概念来提高性能线程又叫做轻量级进程多个线程可以共享同一个地址空间在这样一个系统中一个重量级进程包含一个地址空间和一个或多个控制线程每个线程有自己的程序计数器寄存器状态和栈每个线程可以独立地进行远程过程调用在 4 2 中可以找到R P C的其他扩展它支持对多个服务器的并发访问和对多个请求的同时服务另一种与R P C接近的机制是远程求值 remote evaluation R E V 4 4 它允许把几个过程代码和数据封装在一个过程里传到远程地点就像 R P C中的过程调用一样相应的远程地点执行被封装的过程在封装过程中传送的数据可以被封装过程中的过程多次使用而且产生的中间结果如果有也不必传回客户但是如果不能有效利用以上这些优点由于过程代码和数据的频繁传送反而会增加通信开销而且重定位也是个问题特别是在异型系统中因 34部分分布式系统设计下载为要把可执行代码从一台机器移植到另一台指令集和数据表示都不相同的机器上并非一件容易的事最近又提出了一种上下文驱动调用 context driven call C D C 4 8 模型它是著名的R P C的扩展但结合了 R P C和R E V的优点类似于 R P C C D C允许一系列过程位于一个远程处理机上并通过和本地过程一样的语言结构一个过程调用来调用但C D C采用了不同的实现机制另外 C D C支持个别向远程地点传送数据和从远程地点接收数据的机制程序员无需关心这些数据的移动 C D C支持两种类型的数据对象本地的和远程的本地对象是分配在当前主系统 m a s t e r 的地址空间的一个变量远程对象是分配在从系统 s l a v e 的地址空间的一个变量为了对一个带远程变量的表达式进行本地或远程求值 C D C发送数据给远程地点远程求值并从远程地点接收数据特别地对一个一般的表达式 x e x1 x2 xn 其中至少包含一个远程对象如果它是在本地求值本地地点需要从远程地点接收输入数据如果有执行本地求值最后如果x是一个远程对象的话就把结果数据送回远程地点如果表达式是在远程求值本地地点需要先把输入数据发送到相应的远程地点由远程地点执行远程求值最后如果 x是本地对象的话本地地点从远程地点接收结果类似的情形同样适用于带远程对象的过程 void f x1 x2 xn 的本地或远程求值当远程对象来自不同的远程地点时进行本地求值这种情况下本地地点从远程地点接收远程数据并执行本地求值当所有的远程对象来自同一个远程地点时进行远程求值这种情况下本地地点把本地数据发送给远程地点并在那里执行远程求值为了支持以上操作我们介绍以下函数这些函数可以从客户端本地地点向服务器远程地点请求 rcreate 在远程地点创建一个确定大小的远程对象以一个唯一的名字句柄命名该对象并返回句柄给调用者 rremove 根据输入的对象句柄删除一个远程对象 rread 根据输入的对象句柄和缓冲区地址把一个远程对象拷贝到本地缓冲区 rwrite 根据输入的对象句柄和缓冲区地址把本地缓冲区的内容拷贝到一个远程对象 rfork 是一个非阻塞调用它调用远程桩模块来产生一个新的线程并把远程对象的地址作为参数传递给它以上函数用于实现各种表达式和过程的求值例如 rcreate 和 rwrite 分别用于创建和初始化远程对象对远程过程的调用通过 rfork 实现 rread 用于客户获得一个远程对象的值客户通过rremove 释放一个远程对象的存储空间 D C D L中不包括以上任何机制我们尽量保持发送命令和接收命令的简单使读者能够把重点放在D C D L描述的算法上 2 6 健壮性与集中式系统相比分布式系统有更高的可靠性和有效性但要达到这种可靠性仍然是操作系统语言运行时系统和程序员的责任分布式系统中有两种用于实现可靠性的方法程序设计容错第2章认分布式程序设计语言部分35 下载通信容错这两种方法是相关的程序设计容错可以通过向前恢复 forward recovery 或向后恢复 backward recovery 实现向前恢复试图确定错误所在并基于这个知识改正包含错误的系统状态 11 高级语言如 A d a P L 1和C L U中的异常处理提供了支持向前恢复的系统结构向后错误恢复通过把系统恢复到错误发生前的状态来改正系统状态恢复阻塞方案 recovery block s c h e m e 2 8 提供了这样一个系统结构另外一个常用的程序设计容错技巧是错误屏蔽 n版本程序设计 N version programming 6 利用同一个算法独立开发的几个版本一个最后投票系统将用于这 n个版本产生的结果并最终产生一个正确的结果目前为止还没有支持向后恢复方案的商用语言尽管有些研究人员提出了一些语言框架 3 0 3 2 和底层的支持机制如恢复缓冲 3 和恢复元程序 2 通信容错处理进程通信中发生的故障通信容错依赖于使用的通信方式消息传递还是R P C 和故障的类型故障停止类型 4 1 还是拜占庭类型 3 3 通常有四种类型的通信故障 1 一个节点发出的消息没有到达它的目的地 2 消息不是按原来发送的顺序接收的 3 消息在传送过程中被破坏 4 消息在传送过程中被复制第2 3 4种情况可以通过顺序号数据加密和校验和来解决然而确定出错的原因并非易事例如如果一个调用异常终止计时器超时有四种互斥的可能性 1 接收方没收到调用消息 2 响应消息没到达发送方 3 接收方在调用执行过程中崩溃并且一直保持崩溃状态或崩溃恢复后没有继续原调用的执行 4 接收方仍在执行调用在这种情况下该执行将干扰客户后来的活动最简单的通信容错是使用故障停止模型的消息传递其中 P E要么正常工作要么完全停止容错是通对检测故障并随之对系统进行重新配置实现的 4 以下是用D C D L描述的故障检测过程 4 7 sender s e t u p time t send diagnostic signal to receiver receive ack f ro m receiver status normal t i m e o u t t s t a t u s a b n o r m a l 通过上述高层D C D L算法一个有故障的P E将被发送方节点通过检查状态变量的值发现基于R P C的通信有副作用所以准确地指明一个调用的语义是很重要的各种可靠性语义已经在R P C的上下文中提出正好一次 e x a c t l y o n c e 最后一个 l a s t o n e 至少一次 a t l e a s t o n c e 多个中的最后一个 l a s t o f m a n y 最多一次 a t m o s t o n c e 4 5 36部分分布式系统设计下载在基于对象的系统中 3 5 局部故障是通过利用原子动作的概念 3 7 来实现的原子动作的故障原子性保证了一个计算要么正常终止产生期望的结果要么被异常中断不产生任何结果这个问题的详细讨论见第11章一般而言在分布式系统中实现局部故障是一个多元行动 multidimensional activity 必须同时解决以下部分或全部问题故障限制故障检测故障屏蔽重试故障诊断重配置恢复重起动修复和重新集成这方面问题的详细讨论见 4 6 和最近几年的 I E E E可靠分布式系统会议录 the Proceedings of the IEEE Symposium on Reliable Distributed System 表2 2总结了不同语言中使用的并行性通信和局部故障原语 7 表2 2 语言原语 Language primitive 7 原语实例语言并行性表示并行性进程Ada Concurrent C Linda NIL 对象Emerald Concurrent Smalltalk 语句O c c a m 表达式Par Alfl FX 87 子句Concurrent PROLOG PA R L O G 映射静态Occam StarMod 动态Concurrent PROLOG ParAlfl 迁移 m i g r a t i o n E m e r a l d 通信消息传递点到点消息C S P Occam NIL 会合 r e n d e z v o u s Ada Concurrent C 远程过程调用D P Concurrent CLU LY N X 一对多消息B S P StarMod 数据共享分布式数据结构Linda Orca 共享逻辑变量Concurrent PROLOG PA R L O G 非确定性选择语句C S P Occam Ada Concurrent C SR 带保护H o r n子句Concurrent PROLOG PA R L O G 局部故障故障检测Ada SR 原子事务A rgus Aeolus Av a l o n 零 N I L 第2章认分布式程序设计语言部分37 下载基于对象和面向对象的系统都使用对象的概念但基于对象的系统不支持继承参考文献 1 Adams J C W S Brainerd J T Martin B T Smith and J L Wa g e n e r F o rtran 90 Handbook Intertext Publication McGraw Hill Publishing Company 1992 2 Ancona M G Dodero V Gianuzzi A Clematis and E B Fernandez A system architecture for fault tolerance in concurrent software IEEE Computers 23 10 Oct 1990 23 32 3 Anderson

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

网络分布式系统设计02.pdf

文档简介

温馨提示

最新文档

评论

网络分布式系统设计02.pdf

文档简介

温馨提示

最新文档

评论

相关文档