update for Ascend

This commit is contained in:
ZOMI
2024-07-14 21:11:40 +08:00
parent f77f00e79b
commit 94c3c589ea
3 changed files with 118 additions and 2 deletions

2
.gitignore vendored
View File

@ -1,4 +1,6 @@
~$*
.conda
.venv
_build/
*.zip
*/.ipynb_checkpoints

View File

@ -2,14 +2,128 @@
# 昇腾 AI 全栈架构介绍
昇腾计算的基础软硬件是产业的核⼼,也是 AI 计算能⼒的来源。华为,作为昇腾计算产业⽣态的⼀员,是基础软硬件系统的核⼼贡献者。昇腾计算软硬件包括硬件系统、基础软件和应⽤使能等。
而本书介绍的 AI 系统整体的架构,则是对应与昇腾 AI 产业的全栈架构较为相似。因此这里以昇腾计算产业作为例子,来以实际工业界计算产业中的昇腾作为例子进行阐述。其他计算产业如英伟达、寒武纪、摩尔线程等全栈架构基本与 AI 系统也较为相似。
## 昇腾计算产业介绍
昇腾计算产业是基于昇腾系列HUAWEI Ascend处理器和基础软件构建的全栈 AI 计算基础设施、行业应用及服务包括昇腾系列处理器、系列硬件、CANNCompute Architecture for Neural Networks异构计算架构、AI 计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链。
其生态包括围绕着昇腾计算技术和产品体系所开展的学术、技术、公益及商业活动,产生的知识和产品以及各种合作伙伴,主要包括原始设备制造商 OEM、原始设计制造商 ODM、 独立硬件开发商 IHV、咨询与解决方案集成商 C&SI、独立软件开发商 ISV、云服务提供商 XaaS 等。
同时,昇腾的合作伙伴体系当中还包含围绕昇腾相关产品对外提供服务交付的服务类伙伴,提供培训服务的人才联盟伙伴,提供投融资和运营服务的投融资运营伙伴等。昇腾高度重视高校的人才培养和昇腾开发者的发展,让高校和开发者成为整个昇腾生态的重要组成部分。
### AI 硬件系统
昇腾计算的 AI 硬件系统主要包括有:
- 基于华为达芬奇内核的昇腾系列处理器等多样化 AI 算⼒;
- 基于昇腾处理器的系列硬件产品,⽐如嵌⼊式模组、板卡、⼩站、服务器、集群等。
### AI 软件体系
昇腾计算 AI 基础软件体系主要包括有:
- 异构计算架构 CANN 以及对应的驱动、运⾏时、加速库、编译器、调试调优⼯具、开具链 MindStudio 和各种运维管理⼯具等,开放给⼴⼤的开发者和客户;
- AI 计算框架,包括开源的 MindSpore以及各种业界流⾏的框架 PyTorch作为⽣态的有机组成部分。同时昇腾计算产业秉承开放的⽣态建设思路⽀持各种计算框架的对接。
- 昇腾应⽤使能 MindX可以⽀持上层的 ModelArts 和 HiAI 等应⽤使能服务,同时也可以支持第三⽅平台提供应⽤使能服务。
⾏业应⽤是⾯向⼲⾏百业的场景应⽤软件和服务,围绕昇腾计算体系,诞⽣了⼤量优秀的应⽤,⽐如互联⽹推荐、⾃然语⾔处理、视频分析、图像分类、⽬标识别、语⾳识别、机器⼈等各 Iaas Paas, SaaS 种场景。
昇腾计算产业也拥抱各种云服务场景,⽀持 laasSaaS 等多种云服务模式;同时,端边云协同的能⼒,会原⽣的构建在整个技术架构中,推动昇腾计算成为全场景的 AI 基础设施。
### 产业价值
以“硬件开放,软件开源,使能合作伙伴”的开放⽣态,推动昇腾计算产业更好地发展。华为聚焦计算架构、处理器和基础软件的创新与研发。通过⾃有硬件和伙伴硬件相结合的⽅式客户提供多样化的算⼒选择。华为基于昇腾系列处理器,通过模组、板卡、⼩站、服务器、集群等丰富的产品形态,打造⾯向“端、边、云” 的全场景 Atlas AI 基础设施⽅案。
同时,华为提供 Atlas 模组、板卡等部件,使能伙伴发展基于 Atlas 部件的智能端侧、智能边缘、服务器、集群等 AI 设备。华为提供开源 AI 计算框架 MindSpore同时也⽀持业界主流 AI 框架如 TensorFlow、PyTorch、Caffe 、PaddlePaddle 等,同时华为提供模型转换⼯具⽀持主流模型便捷的转换。
昇腾计算产业发展致⼒于将 AI 新技术的红利带到世界的每个⻆落,让⼈⼈充分享受 AI 带来的美好。在 AI 治理上,华为与⽣态、商业伙伴共同倡导向善、包容、普惠和负责任的 AI为⼈类社会发展带来价值
- ⽤得起:⽆论何⼈,何时,何地,想⽤就⽤,⽆所不及。
- ⽤得好:从芯⽚到架构,提供安全可靠的产品和服务,赋能合作伙伴和开发者,做好“⿊⼟地”。
- ⽤得放⼼:开放,透明,合作,遵守各国法律法规,保证个⼈隐私和数据安全。
## 昇腾 AI 系统架构
昇腾计算中的硬件体系、基础软件、开发工具链、AI 计算框架、应用使能等如图所示,跟全书介绍的 AI 系统基本上逻辑吻合。
底层的 AI 芯片和结构体系在昇腾 AI 全栈架构中主要指具体的硬件,覆盖了端边云全场景,支持数据中心,边缘和终端测的灵活部署方式。基础软件则是对应本书中 AI 系统的编译以及 AI 计算架构,使能芯片能力,提供具体的软件计算能力。再往上的框架层则是包含 AI 推理引擎、AI 计算框架。最后上层的应用使能则是针对具体的算法和模型提供的封装等相关的接口。
![](images/05Ascend01.png)
为满足最大化 AI 开发和部署的灵活性,昇腾整体 AI 架构遵照如下的设计理念。
- 模块化支持端边云场景下的独立部署
- 模块之间具备相互协同能力
- 各个层之间⽀持独⽴演进
基于统⼀的端边云全场景框架下,与合作伙伴⼀起,为最终客户带来的 AI 算⼒平台主要有以四点优势。
### 超强算⼒
在数据中⼼侧处理边缘侧汇聚过来的海量数据和满⾜上亿级参数的⼤规模模型的深度学习需求。Atlas 训练卡可为服务器提供320 320 TFLOPS FP16 的⾼算⼒。针对更⼤规模需求Atlas 集群提供256P ~ 1024P FLOPS FP16总算⼒在 ResNet-50测试中基于 ImageNet 数据集训练时间达到⽬前业界最快的25.9s。在边缘侧,满⾜不同场景的灵活轻 25.9s。在边缘侧,满足不同场景的灵活轻量级部署的同时提供了强⼤算⼒。 Atlas 推理卡单卡算⼒达 88 TOPS INT8并支持多路全⾼清视频实时分析。
⾼算⼒的同时能效⽐同样关键。在数据中⼼侧更⾼的能效⽐可⼤幅降低数据中⼼整体运营成本。具体来说Atlas 集群作为业界⾸个全液冷 AI 集群,采⽤板级液冷、柜级⻛液换热器等独特设计,使数据中⼼ PUEPower Usage Efficiency能源使⽤效率<1.1节约量电费E 级算集群5年节省电费超1亿元在边缘侧模组能效达2 TOPS/W适应低功耗和边缘部署需求
### 全栈开放
坚持开源开放原则,⽬的是为了希望构建良好的产业按能分层开放。⾯向不同开发者提供不同开发具和套件使能开发者满在极简开发和极致性能两⽅⾯的需求
向最上层的业务应开发者他们把 AI 变成服务各业对于这类开发者MindX 开放持上层的 ModelArts HiAI 等应使能服务同时也可以持第三平台提供应使能服务MindX 也逐步提供 SDKSDK 向同业场景的完整开发具包和对应的业知识库让针对业的开发经验和业知识可以积淀下来快速复制SDK 让开发者ISV 只需极少量代码甚不需要代码就可以实现 AI 的功能
AI 模型开发者他们专注于算法开发基于昇腾的开源框架 MindSpore PyTorch TensorFlow PaddlePaddle 可以效开发同时华为提供模型转换持主流模型便捷的转换到昇腾设备下
向向算子开发者提供了 CANN MindStudio 持底层开发基于统编程接Ascend C实现分层开放能⼒。Ascend C 封装了内存管理AI 任务管理AI 任务执⾏、业务流事件图引擎等通⼝,开发者只需要掌握 API就可以全使昇腾硬件的能⼒。同时将开放环境与底层硬件相解耦实现后向兼容可以最程度的保护开发者的数字资产
### 使能应⽤
泛的业应开发者通常期望把 AI 当做种服务直接应在各个业领域中类开发者需理解背后神经络模型是什么AI 框架是什么资源是如何调度等技术细节
昇腾应使能 MindX 为这类的 AI 开发者设计深度学习组件 MindX DL 和智能边缘组件 MindX Edge,⽀ ModelArtsHiAI Service 及第三使能平台等多种平台可以将设备资源资源统的抽象管理被上层平台所调⽤,这样程序只需关注功能不需要关注硬件的底层配置细节
除此之外MindX 还提供优选模型库 ModelZoo SDKModelZoo 解决了模型的选型难训练难优化难等问题SDK 向同业场景的完整开发具包和对应的业知识库让针对业的开发经验和业知识可以积淀下来快速复制SDK 让开发者ISV 只需极少量代码甚不需要代码就可以实现的功能
### 端边云协同
端边云协同使能全场景 AI 开发在硬件层⾯,端边云设备均采的华为达芬奇架构CANN 使能各类形态硬件⼿摄像机智能汽⻋,⼩服务器集群等
在软件层⾯,⽀乎所有主流操作系统多种 AI 框架让开发者次开发端边云全场景都可以灵活部署同时端侧的增量数据可以回传云侧实现进步训练优化云侧再训练后的优化模型可以直接下发端侧中间需转换
在架构层⾯,MindSpore 向端云全场景的 AI 计算框架可以实现全场景适应感知与协同,⽐如模型训练好后可以根据不同硬件形态适应成相应⼤⼩的模型
MindSpore 持在端侧直接对模型进轻量训练更新本地的推理参数这样既保护了个隐私又提升了模型精度实现模型订制”。
## 昇腾未来展望
昇腾计算产业会持续推动多样化异构算力发展随着 AI 系统架构丰富多样和 AI 应用的大规模推广昇腾计算产业会持续的增加多种算力支持在面对不同的应用场景充分发挥多种算力的协同效果达到最优的处理效率和性能
尤其是多种加速器比如数据与处理和后处理多种处理器架构和内核架构等都可能在昇腾计算中发挥算力由应用驱动的计算架构将成为昇腾计算发展趋势随着产业的持续进展当规模增大到一定程度之后昇腾计算的底层 AI 系统会进化到更高一层的产品形态而无论是在数据中心还是边缘场景甚至是端测场景高集成度的 SoC 系统会成为主要形态之一
随着异构计算架构成为主流可编程性和领域开发语也会成为个重要复杂的异构系统将越来越依赖智能化的编译系统来进性能的优化。⽽昇腾计算体系将围绕以智能编译系统和动优化的开发体系作为持续的投⼊。基础软件的智能化程度将获得极的提升通过 AI 来开发 AI 将成为可能
昇腾计算产业的态将会持续不断丰富更多的性能算法计算加速库SDK、⾏开发语开发者产品形态合作伙伴将会随着昇腾计算产业的发展快速推进
未来将有百万量级的开发者基于昇腾计算产业来开发,⽽昇腾的应场景将会触及到社会和活的⽅⽅⾯⾯。
昇腾计算产业将持续推进极简易的开发体系和极致性能的应效果随着计算成本和开发成本 的下降以及应的快速成熟业和活中规模的部署昇腾计算系统将成为很快的现实
昇腾计算在业中的规模落地将对社会的推进我们认为未来在智能制造 机器⼈、虚拟⼈、内容、⾃动和辅助驾驶移动互联⽹、智慧农业教育交通能源等都将受益于昇腾计算产业所带来的智能化平提升
安全和可信已经成为昇腾计算产业的基本功未来安全和可信也依然是坚强的保障随着 模的产品化落地必将出现量的安全挑战如何应对这些挑战则会是整个产业的重问题昇腾计算将把持续的安全和可信 AI 作为基础确保 AI 可靠的服务于
昇腾计算产业作为 AI 的基⽯,将以极简易⽤, Al 计算处不在以极致性能 Al 计算所不及昇腾计算产业将秉承着把数字世界带每个⼈、每个家庭每个组织构建万物互联的智能世界的理念与合作伙伴和客户为美好的 AI 新时代⼒。
## 小结与讨论
- 由于系统的多层抽象造成 AI 实践和算法创新的过程中已经无法感知底层系统的运行机制。
- 昇腾 AI 架构是华为基于昇腾系列处理器构建的全栈 AI 计算基础设施包括硬件基础软件AI 框架和应用使能旨在打造开放的生态系统推动 AI 技术的广泛应用
- AI 系统底层的作用和复杂性,从而指导上层 AI 作业、算法、代码更加高效的执行和编写。
- 昇腾 AI 系统提供从硬件到应用的全栈解决方案强调模块化协同和独立演进以支持端云全场景的 AI 开发和部署具备超强算力和高能效比
- 昇腾计算产业致力于 AI 技术的普及和社会责任通过开放的生态和技术创新使 AI 计算更加易于使用高效和安全以支持广泛的行业应用和智能化发展

Binary file not shown.

After

Width:  |  Height:  |  Size: 245 KiB