8月28日,“云上有信仰AI——华为云中国行2018”在成都火车站如期举行。华为EBG中国区行业云开发部总监胡玮琪在“做有信仰的云,在创新路上加速奔跑”的主题演讲中,发布了华为云两款新品——GPU共享的AI容器和Istio服务网格。这是继裸机容器、Windows容器等重大特性之后,华为云在容器领域的又一次技术突破,将极大推动AI技术的普及,助力“普惠AI”战略加速落地,为用户提供用得起、用得好、放心的AI云平台。
华为EBG中国区工业云开发部总监胡玮琪做了现场发布。
全球首发GPU共享型高性能AI容器,让人工智能触手可及目前,人工智能已经成为各行各业的热点和趋势。在实际应用中,企业在各种AI计算场景下不断追求性能和成本的极致体验。容器凭借其独特的技术优势,成为主流AI计算框架(如Tensorflow和Caffe)的核心引擎。为了进一步解决企业面临的AI计算性能和成本问题,华为云为企业量身定制了AI容器产品。
华为云AI容器是全球首款支持共享GPU的高性能容器产品。在业内率先实现多容器共享GPU资源,大幅降低AI计算成本,AI计算性能比通用方案提升3-5倍。
极致性能
裸机NUMA架构和高速IB网卡将性能提升了3-5倍。
在典型的深度学习模型训练场景中,需要传输和处理海量数据。
华为云AI container运行在高性能裸机服务器上,通过NUMA架构和100G IB网卡实现高速、低时延的大数据传输,使GPU充分发挥大规模并行计算的优势,从而大大缩短训练时间。实践证明,深度学习训练相比传统的GPU加速方法可以进一步提高3-5倍。
高效计算
GPU资源的多容器共享调度大大降低了计算成本。
通过优化K8S容器调度引擎,华为云可以为容器中的AI计算任务分配更细粒度的GPU资源,实现多个AI计算任务共享GPU,在推理场景等部分AI计算场景中实现更高的资源利用率,从而大幅降低AI计算成本。
成熟的应用
主流的GPU模型在华为云ei产品中得到充分适配和广泛应用。
华为云AI container完成了众多主流GPU的适配,包括英伟达特斯拉P4/P100/V100等产品系列,客户可以根据不同应用场景灵活选择,实现最高性价比。
华为云AI容器支持Tensorflow、Caffe等主流深度学习框架,已在华为云ei的深度学习、推理平台、人脸/图像/文本识别等多项服务中得到广泛应用和验证。
国内首发公有云Istio服务网格,让云原生应用治理更简单华为EBG中国区行业云开发部总监胡玮琪现场分享:“在Cloud 2.0时代,容器技术解决了应用的快速部署、上线、升级、弹性伸缩等运维效率问题,但在应用运行过程中的灰度释放、流量管理、健康管理等方面仍存在诸多困难。Istio是云原生生态系统的重要组成部分。通过提供完整的无创微服务治理解决方案,可以很好地解决云原生应用管理、网络连接、安全管理等应用网络治理问题。”
华为云在云容器引擎CCE中深度集成了最新版本的Istio,在易用性、可靠性、可视化等方面做了一系列增强。
一键启动,与容器引擎无缝集成
华为云容器引擎CCE实现了Istio的深度集成,无需用户自行安装,创建集群时只需勾选即可在集群和应用中启用完整的Istio服务网格,实现开箱即用。
内置多种灰度发布流程,确保应用程序顺利升级。
应用上线后,运维的一大挑战就是如何进行在役软件升级。华为云Istio服务网格内置了canary、A/B测试等多种灰色发布策略,完美解决了这一问题。用户还可以定制配置,以实现更复杂的流量策略。
图形化应用程序拓扑,用于可视化流量治理
华为云Istio服务网格提供可视化流量监控,异常响应、长响应延迟、流量状态信息拓扑一目了然;同时,结合华为云AOM/APM服务,提供详细的微服务级流量监测、异常响应流量报告和呼叫链信息,实现更快、更准确的问题定位。
智能路由和灵活的流量管理让流量管理变得更加简单。
华为云Istio服务网格支持根据微服务的流量协议,提供战略性、场景化的网络连接和安全策略管理能力。支持基于应用拓扑的服务配置负载均衡、融合容错等治理规则,提供实时、可视化的微服务流量管理。该应用程序无需任何修改即可进行动态智能路由和灵活的交通管理。
CCE(Cloud Container Engine)是华为云提供的企业级容器应用管理服务。它致力于为客户提供高安全性、高可靠性、端到端的容器全栈解决方案,全面兼容Kubernetes社区的原生应用和工具,极大简化了云上自动化容器运行环境的构建。