书籍详情

昇腾AI处理器架构与编程:深入理解CANN技术原理及应用

昇腾AI处理器架构与编程:深入理解CANN技术原理及应用

作者:梁晓峣

出版社:清华大学出版社

出版时间:2019-09-01

ISBN:9787302534525

定价:¥69.00

购买这本书可以去
内容简介
  本书系统论述了基本达芬奇架构的昇腾(Asccnd)AI处理器的原理、架构与开发技术。全书共分6章,内容涵盖了神经网络理论基础、计算芯片与开源框架、昇腾AI处理器软硬件架构、编程理论与方法,以及典型案例等。为便于读者学习,书中还给出了基本昇腾AI处理器的丰富的技术文档、开发实例等线上资源。 \n本书可以作为普通高等学校人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生及研究生教材,也适合作为从事人工智能系统设计的科研和工程技术人员的参考用书。 \n
作者简介
  梁晓峣上海交通大学计算机科学与工程系教授、博士生导师、学科带头人。毕业于美国哈佛大学,获得博士学位。研究方向包括计算机体系结构、集成电路设计、通用图形处理器和人工智能芯片架构等。发表论文80余篇(包括国际学术会议(ISCA、HPCA、MICRO、ISSCC、DAC、ICCAD等)论文),其中2篇入选计算机体系结构年度论文(IEEE MICRO TOP PICKS)。
目录

CONTENTS

\n


\n

目录

\n


\n

第1章基础理论00

\n


\n

1.1人工智能简史00

\n


\n

1.2深度学习概论00

\n


\n

1.3神经网络理论0

\n


\n

1.3.1神经元模型0

\n


\n

1.3.2感知机0

\n


\n

1.3.3多层感知机0

\n


\n

1.3.4卷积神经网络0

\n


\n

1.3.5应用示例0

\n


\n

第2章行业背景0

\n


\n

2.1神经网络芯片现状0

\n


\n

2.1.1CPU0

\n


\n

2.1.2GPU0

\n


\n

2.1.3TPU0

\n


\n

2.1.4FPGA0

\n


\n

2.1.5昇腾AI处理器0

\n


\n

2.2神经网络芯片加速理论0

\n


\n

2.2.1GPU加速理论0

\n


\n

2.2.2TPU加速理论0

\n


\n

2.3深度学习框架0

\n


\n

2.3.1MindSpore0

\n


\n

2.3.2Caffe0

\n


\n

2.3.3TensorFlow0

\n


\n

2.3.4PyTorch0

\n


\n

2.4深度学习编译框架——TVM0

\n


\n


\n

第3章硬件架构0

\n


\n

3.1昇腾AI处理器总览0

\n


\n

3.2达芬奇架构0

\n


\n

3.2.1计算单元0

\n


\n

3.2.2存储系统0

\n


\n

3.2.3控制单元0

\n


\n

3.2.4指令集设计0

\n


\n

3.3卷积加速原理0

\n


\n

3.3.1卷积加速0

\n


\n

3.3.2架构对比0

\n


\n


\n

第4章软件架构0

\n


\n

4.1昇腾AI软件栈总览0

\n


\n

4.2神经网络软件流

\n


\n

4.2.1流程编排器

\n


\n

4.2.2数字视觉预处理模块

\n


\n

4.2.3张量加速引擎(TBE)

\n


\n

4.2.4运行管理器

\n


\n

4.2.5任务调度器

\n


\n

4.2.6框架管理器

\n


\n

4.2.7神经网络软件流应用

\n


\n

4.3开发工具链

\n


\n

4.3.1功能简介

\n


\n

4.3.2功能框架

\n


\n

4.3.3工具功能

\n


\n

第5章编程方法

\n


\n

5.1深度学习开发基础

\n


\n

5.1.1深度学习编程理论

\n


\n

5.1.2深度学习推理优化原理

\n


\n

5.1.3深度学习推理引擎

\n


\n

5.2昇腾AI软件栈中的技术

\n


\n

5.2.1模型生成阶段

\n


\n

5.2.2应用编译与部署阶段

\n


\n

5.3自定义算子开发

\n


\n

5.3.1开发步骤

\n


\n

5.3.2AI CPU算子开发

\n


\n

5.3.3AI Core算子开发

\n


\n

5.4自定义应用开发 

\n


\n

第6章实战案例

\n


\n

6.1评价标准

\n


\n

6.1.1精度

\n


\n

6.1.2交并比

\n


\n

6.1.3均值平均精度

\n


\n

6.1.4吞吐量和时延

\n


\n

6.1.5能效比

\n


\n

6.2图像识别

\n


\n

6.2.1数据集:ImageNet

\n


\n

6.2.2算法:ResNet

\n


\n

6.2.3模型迁移实践

\n


\n

6.3目标检测

\n


\n

6.3.1数据集:COCO

\n


\n

6.3.2算法:YoloV3

\n


\n

6.3.3自定义算子实践

\n


\n

附录A缩略词列表

\n


\n

附录BAscend开发者社区及资料下载

\n


\n

附录C智能开发平台ModelArts简介

\n


\n


猜您喜欢

读书导航