彩票天下

  • <tr id='rDnnbs'><strong id='rDnnbs'></strong><small id='rDnnbs'></small><button id='rDnnbs'></button><li id='rDnnbs'><noscript id='rDnnbs'><big id='rDnnbs'></big><dt id='rDnnbs'></dt></noscript></li></tr><ol id='rDnnbs'><option id='rDnnbs'><table id='rDnnbs'><blockquote id='rDnnbs'><tbody id='rDnnbs'></tbody></blockquote></table></option></ol><u id='rDnnbs'></u><kbd id='rDnnbs'><kbd id='rDnnbs'></kbd></kbd>

    <code id='rDnnbs'><strong id='rDnnbs'></strong></code>

    <fieldset id='rDnnbs'></fieldset>
          <span id='rDnnbs'></span>

              <ins id='rDnnbs'></ins>
              <acronym id='rDnnbs'><em id='rDnnbs'></em><td id='rDnnbs'><div id='rDnnbs'></div></td></acronym><address id='rDnnbs'><big id='rDnnbs'><big id='rDnnbs'></big><legend id='rDnnbs'></legend></big></address>

              <i id='rDnnbs'><div id='rDnnbs'><ins id='rDnnbs'></ins></div></i>
              <i id='rDnnbs'></i>
            1. <dl id='rDnnbs'></dl>
              1. <blockquote id='rDnnbs'><q id='rDnnbs'><noscript id='rDnnbs'></noscript><dt id='rDnnbs'></dt></q></blockquote><noframes id='rDnnbs'><i id='rDnnbs'></i>
                教育装备采购网
                第六届图书馆论坛580*60

                才云科技为高校打造 HPC 平台管理系统

                教育装备采购网 2019-07-30 14:37 围观2191次

                  ? 近年来,围绕 AI 技术的国际竞争正愈演愈烈。为了抢占先机,设立 AI 专业成了各大高校顺应科技发展趋势的重大举措。为帮助高校推进 AI 技术领域的人才培养、研究开发和成果转化,才云科技打造定制化 HPC 集群平台管理系︾统,支持国家科技建▃设。

                  某高校是由上海市人民政府和中国科学院共同举办的一所“小规模、高水平、国际化的研究型、创新型”大学。它借鉴了世界一流理工科大学的发展经验,从理工科入手培养各科专业人才,推进研究成□ 果在各行业落地。

                  作为『人工智能高校联盟的倡导者之一,为更好地进行 AI 学科建设,进一步巩固学校在计算机视觉、自然语言处理、深度学习、图形学等◇领域的优势,该高校联手才云科技,为高性能计ζ算(HPC)集群◆打造了一套平台管理系统,为提升集群计算效率、提高资源利用率、降低成本提供了极大支持。

                  AI 学科建◎设需从 HPC 起步

                  高校 HPC 集︽群是一种为学校密集型科研任务提供高性能计算支持的计算硬件,通常计算速度要达到每秒万亿次级。作为科学研究不可或缺的计算工具,它在研究领域有着广泛的应用和巨大的影响力,也是衡量一所学校科研实力的重要指标之一。

                  自¤建校以来,该高校依托高「性能 HPC 集群,已在物理、化学、生命科学等领域实现巨大科研进展。而随着 AI 研究的☆逐步展开,考虑到 AI 研∩究离不开庞大的数据、精确的数据标记和数十倍于一般科研项目的计算量,学校对用 HPC 集群支撑』深度学习任务,促进 AI 与 HPC 的融合提出了更高『的要求。

                  同时,为了承担更多国家级、地级科研课题,加快进行学科建设和人才培养,一些可预见的长▅期问题々,如计算资源部署、使用现状与日益增长的科研任务需求之间的↙矛盾也亟需得到重视:

                  物理资源管理零散。该高校在浦东浦西建有两个数据中心,各数据中心内的机器配置不一,共有 8 个集群、124 台服务器、近 300 块 GPU、大量 CPU 及内存资源。虽然规模█庞大,但这些资源缺乏有效的统一管理工具,存在计算资源过于分散、缺乏高效统筹机制的问∑题;

                  资源申①请不规范。为满足各学科科研需求,学校一般都有针对「 HPC 集群使用的完善申请、使用手册。但该高校的▼资源申请流程仍过于繁琐,缺乏自动化的资源申请、分配工具。当申请人提交申请后,计算资源需要依靠人工手动分配,无法实≡现即租即用,整个过程耗时耗力;

                  资源利用㊣ 率低。该高校的服务器资源只能以整机的方式分配给各教研室,例如一台服务器有 6 块 GPU,当某个 AI 任务只需使用 5 块 GPU 时,申请人会被分到一整台服务器,如此分配←方式往往导致资源使用不饱和,造成浪费;

                  资源回收困难。任务结●束后,由于需要人工手动清理机器遗留数据,该高校的 HPC 集群也存在资源回收不及时※、机器时常处于闲置状态的问题。

                  才云:构建 HPC 集群平台ζ 管理系统

                  针对该高校 HPC 集群的使用现】状,才云科技基于自研智能容器云平台 Caicloud Compass 和人工智能云平台 Caicloud Clever,打造了一套定制化的№ HPC 集群平台管╲理系统。

                  新系统实现了计算资源的池化管理和机器〓资源的逻辑化分配,并依靠对底层高性能计算资源的科学管理,大幅提升了深度学习项目的分布式训练能力。

                  助力学科建设,创建深度学习平台√方案

                  为了让高校 HPC 更好地¤承担 AI 科研项目,才云科技在 HPC 集群平台◆管理系统中集成了深度学习平台方案,能为高校数据管理、模型构建、模型上线提供一站式便捷服务。

                  具备深度学习全流程工程化管理能力。HPC 集群平台管理系统♀集数据导入、数据处理、模型开发、模型训练、服务上线、模型管◤理等功能于一体,可有效支持语义分析、仿真模拟、图形渲染等深度学习科研※项目,帮助高校简化项目流程、加速项目开展进度。

                  集成 infiniband 网络。infiniband 网络是用于 HPC 的计算机网络通信标准,具有极高★吞吐量和极低延迟的特点,既可用↓作服务器与存储系统之间的直接或交换互连,也可用于存储系▓统之间的互连。考虑到深度学习对计算速度的苛刻要求,HPC 集群平台管理系统集成 infiniband 网络,为 AI 项目运算速度提供保障。

                  集成并行存储系卐统。在 HPC 中,传统 NFS 存储在■集群不断增加时易出现存储瓶颈,而才云科技集成的并行存储则可以把后端的多套存储阵列统一成一个大的存储,不仅保证了可靠性,读写性〓能和带宽也更出色,帮助高校显著提高运算效率。

                  构建资源池,统一管理Ψ 物理资源

                  为了破解该高校物理资源分散两地的难题,才云科技的 HPC 集群平台管理系统将两个中心的 124 台服务器资源统一纳管至系统环境内,实现了计算资源的平台级统筹≡管理。

                  系统可以依据主机生命周期、状态、性能对计算资源做细粒度划分,提供 CPU、GPU、内存、网络负载、任务运★行数量等指标的可视化监控及灵活高效的服务器上下线功能,帮助高校大幅提升资源利用率,确保所有资源的安全可用。

                  细化申请流程,自动回收资△源

                  才云科技的 HPC 集群平台管理系统具备用户权限管理体系,实现了资源按系统管理员、教研室↑管理员、学生(教师)三级用户划分。

                  全量〖集群资源由系统管理员统一管理,各教研室管理员先向系统管理员申请教研室所需资源,再按需分配给学生、教师。任务结束后,系统管理员只需在 HPC 资源管理可视化●界面调低额度或关闭教研室账号,即可完成资源ζ 回收,资源申请回收效率大幅提升。

                  提供自动化运维能力,提高资源利用率

                  为了提升 HPC 集群管理的自动化水平,才云科技 HPC 集群平台管理系统提供应用、AI 模型@任务开发运维过程中的一些常见管理能力,如用户环境隔离管理、任务生命周期管理、容器∑ 生命周期管理、代码开发管理、存储管理、镜像管理、监控管理、日志管理、配置管理等,大大减轻工作人员的工作负担。

                  展望未来

                  自上线后,才云科技的 HPC 集群平台管理系统为该高校降低人力成本、减少浪费、提高 HPC 集群资源利用率提供着巨大支持。在ξ 该系统的助力下,该高校的 AI 科研成果也在国际上高☆光频现,推动上海成为全国的 AI 科研高地。

                  更可︽喜的是,和才云科技的合作还让该高校看到了利用自建云开拓教育行业公有云的前景。为了更好地发挥数据中心的价值,该高校可将暑假〗期间闲置的计算资源以公有云的形式对外提供 ,打造人工智能云,帮助更多高校和企业加速 AI 研发和成果落地。

                  根据国务院 2017 年发布的人工智能发ㄨ展规划,到 2020 年,中国人工智能总体技术和应用与世界先进※水平同步,人工智能核心产业规模超过 1500 亿元,带动相关产业规模超过 1 万亿元。在当前这个实现 AI 加速发展的绝佳时刻,才云科技希望能帮助更↘多高校抓住机遇,艰苦奋斗,只争朝夕,助力中国 AI 赢在♀起跑线。

                来源:才云科技 责任编辑:王道 我要投稿
                普教会专题840*100

                相关阅读

                • 应用专家将领衔报告2013HPC用户大会
                  教育装备采购网09-17
                  随■着高性能计算技术的普及,高性能计算》已经被广泛的应用在国家命脉、百姓民生等方方面面。可以说,高性能计算已经成为各个国家科技实力甚至是国力强弱的一个象征,代表着一个ぷ国家实力发展的水平...
                • 浪潮专业应用服务 成功保卫西安交大HPC系统安全
                  教育装备采购网05-18
                  厂商的客户服务质量是构建整体竞争力的一个关键因素。作为中国高性能计算一面旗帜,浪潮HPC强调应用驱动高性能产业发展,并从提供▃高性能计算专业、专家级的应用服务入手,构筑高性能专业应用服务...
                • 从山东大学高性№能集群看HPC的发展趋势
                  赛迪网12-21
                  HPC市场正发生着微妙变化。近日,浪潮为山东高性能计算♂中心提供的基于刀片集群的天梭TS10000高性能集群系统已正式投入使╱用,承担着国家211工程、985工程等山东大学重大科研项目的计算工作。在计...
                • 香港大学用戴尔HPC集群为国家网格铺◤路
                  IT16808-30
                  作为内地超级计算机网络中国国家网格的一部分,香港大学高性能计算集群是内地以外唯一的网格节点。2010年8月,戴尔公司宣布成功为香港大学设计了高性能计算集群(High-PerformanceComputingClust...

                版权与免责声明:

                ① 凡本网■注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本@网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

                ② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的︻在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直々接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负︽版权等法律责任。

                ③ 如涉□ 及作品内容、版权等问题,请在作品发表之日起◤两周内与本网联系,否则视为放弃相关权利。

                2022云展会300*245