作业调度软件课件_第1页
作业调度软件课件_第2页
作业调度软件课件_第3页
作业调度软件课件_第4页
作业调度软件课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京师范大学作业管理软件 介绍OverviewHPC集群作业管理系统介绍TSJM V2.0主要功能介绍TSJM V2.0高级功能介绍HPC集群主要作用运行科学计算任务流体力学 :fluent分子动力学 :vasp生命科学:named基因测序 :blast材料学 : material stutio地质航天气象在集群中每个计算任务称之为一个作业作业管理系统简介作业管理是集群管理的重要组成部分几百台服务器几十种应用,上百个用户每天提交成百上千个作业,同时有几百个作业在运行每个作业占用几十个节点,运行几天,甚至一个月资源使用统计困难手动管理作业已经不可能,需要专门的作业管理系统统一管理集群中的资源和作

2、业,规范作业的提交方式,按照一定的规则给作业分配资源,并对作业的资源使用情况进行统计。浪潮天梭作业管理软件2.0模块组成图浪潮HPC作业管理软件功能模块包括状态管理、系统管理、作业管理、策略管理、统计管理、以及用户管理六个功能模块浪潮天梭作业管理软件2.0模块组成图作业模块是整个系统的中心,其他的功能模块都是围绕作业服务的作业状态策略统计用户系统作业管理作业提交:命令行作业提交Web图形界面作业提交上传应用算例上传作业脚本编辑或新建作业脚本通过应用模板提交高级属性设置作业提交界面简洁明了,符合用户的使用习惯作业管理查询作业状态:查询作业详细信息查询作业输出内容查询作业调度日志通过图形界面可以方

3、便的查看作业的调度及运行信息作业管理作业控制:强制执行作业删除作业停止作业设置checkpoint重新运行作业作业模板管理应用模板管理,将常用应用设置为模板,可实现作业的快速提交对MPICH/MPICH2/Vasp/Fluent/Wien2k/ Gaussian/ Materials Studio等以上目前国内最常用的应用软件提供应用模板或作业脚本支持支持用户自定义应用软件模板状态监控监控当前系统中的作业情况监控集群中的整体资源使用情况,包括CPU,MEM以及各节点状态管理员可以掌握实时掌握系统运行状态以及集群资源使用情况系统管理集群管理支持多集群管理实时查看集群资源使用率及节点的状态和负载情

4、况系统管理批处理器管理查看并设置批处理器属性系统管理队列管理管理查看并设置当前集群系统中的队列及其属性系统管理功能池管理对集群资源进行逻辑分区,运行相同应用的节点划分到同一个功能池中,合理利用资源策略管理为了合理并充分利用其群资源,需要对集群中的用户进行资源的限制,对作业执行的顺序设置合理的规则,为资源的分配设配合理的策略信任域优先级策略作业回填策略节点分配策略公平共享策略资源预留策略通过设置这五种策略的具体参数值,可以满足客户各种需求策略管理公平共享:可以统计用户的资源使用量,并设定公平共享的调度策略,使作业管理软件能具有根据用户资源使用量的多少来合理调度用户作业。例如:某用户的资源使用过多

5、,软件可以自动降低该用户作业的优先级,并优先执行资源使用量少的用户的作业,这样就保证了各用户之间可以公平的使用集群系统中的资源,解决资源分配不均衡问题资源预留:可以进行资源预留,将某个或几个计算资源,在某段时间预留给某个用户/用户组或者队列,对比较重要的用户进行资源预约资源回填策略:可以通过设置回填量度、回填深度设定资源回填策略,提高计算资源利用率策略管理统计管理统计用户使用的各种资源情况,能根据管理员的记账配置信息,生成记账信息,为用户记账和付费提供依据将报表导出为PDF或XLS文件统计管理统计用户完成的每个作业的资源量,并对其进行计费将报表导出为PDF或XLS文件统计管理统计集群完成的所有

6、作业的资源使用情况,并根据作业的运行时间和作业消耗资源绘制图表管理节点计算节点千兆网络IB网络管理网络.高级功能-选择网络计算网络的选择用户在提交作业时,可以根据需要选择作业运行的网络;例如:某些应用在管理网络上提交后,可以根据需要,设定运行在哪个计算网络(千兆计算网络/IB计算网络/万兆计算网络)高级功能-作业提醒作业信息及时反馈客户作业提交人员在作业提交后,可以及时便捷的获得作业开始运行/运行异常/运行完成等作业执行状态的信息;通过短信或EMAIL发送作业状态信息 GSM高级功能-上传功能上传作业脚本或应用算例,简化作业提交过程,快速提交作业高级功能系统级checkpoint功能在作业运行

7、过程中对作业某一时刻的运行结果和状态进行保存,当作业运行出错时可以从作业保存点恢复作业的运行,可有效地防止意外的发生,提高作业的成功率报表生成功能按月自动生成报表,统计系统的使用率及各个用户的资源使用情况将报表导出为PDF或XLS文件计算节点内存检测功能实时检测计算节点内存使用状况,当内存剩余小于设定值时,删除该节点的作业多种节点分配策略支持最小满足资源需求的节点分配策略、按CPU负载进行节点分配的策略等四种节点分配策略,使用户可以根据作业特点来配置节点分配策略一个支持web图形和命令行方式进行作业管理的软件,远程web访问,操作可靠简单支持同时管理多个集群,集群系统的资源共享,提高集群的利用率支持多种作业调度策略和节点分配策略,包括各种优先级调度策略,以及资源预留/公平共享/资源回填等调度策略,并且支持用户自定义作业调度策略;支持最小满足资源需求的节点分配策略、按CPU负载进行节点分配的策略等节点分配策略支持应用管理,对MPICH/Vasp/Fluent/Wien2k/ Gaussian/ Materials Studio等以上目前国内最常用的应用软件提供应用命令封装或作业脚本支持支持作业记账管理,为用户记账和付费提供依据支持提交作业选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论