(报告出品方/作者:国信证券,熊莉)
算力芯片研究框架
计算芯片是算力时代下智能网联汽车的核心
计算芯片可分为MCU芯片与SoC芯片。随着汽车EE架构的不断革新,汽车半导体高速发展,按功能不同,汽车半导体可分为汽车芯片和功率半导体,而在汽车芯片中,最重要的是计算芯片,按集成规模不同,可分为MCU芯片与SoC芯片。MCU(MicroControlUnit)微控制器,是将计算机的CPU、RAM、ROM、定时计数器和多种I/O接口集成在一片芯片上,形成芯片级的芯片;而SoC(SystemonChip)指的是片上系统,与MCU不同的是,SoC是系统级的芯片,它既像MCU那样有内置RAM、ROM,同时又可以运行操作系统。
智能化趋势驱动汽车芯片从MCU向SoC过渡。自动驾驶对汽车底层硬件提出了更高的要求,实现单一功能的单一芯片只能提供简单的逻辑计算,无法提供强大的算力支持,新的EE架构推动汽车芯片从单一芯片级芯片MCU向系统级芯片SoC过渡。
SoC市场高速发展,预计年市场规模达到亿美元。汽车智能化落地加速了车规级SoC的需求,也带动了其发展,相较于车载MCU的平稳增长,SoC市场呈现高速增长的趋势,根据GlobalMarketInsights的数据,预计全球车规级SoC市场将从年的10亿美元达到年的亿美元,CAGR达到35%,远超同期汽车半导体整体增速。
传统MCU:MCU需求稳步增长,海外寡头长期垄断
MCU是ECU的运算大脑。ECU(ElectronicControlUnit,电子控制单元)是汽车EE架构的基本单位,每个ECU负责不同的功能。MCU芯片嵌入在ECU中作为运算大脑。当传感器输入信号,输入处理器对信号进行模数转换、放大等处理后,传递给MCU进行运算处理,然后输出处理器对信号进行功率放大、数模转换等,使其驱动如电池阀、电动机、开关等被控元件工作。
MCU根据不同场景需求,有8位、16位和32位。8位MCU主要应用于车体各子系统中较低端的控制功能,包括车窗、座椅、空调、风扇、雨刷和车门控制等。16位MCU主要应用为动力传动系统,如引擎控制、齿轮与离合器控制和电子式涡轮系统等,也适合用于底盘机构上,如悬吊系统、电子动力方向盘、电子刹车等。32位MCU主要应用包括仪表板控制、车身控制以及部分新兴的智能性和实时性的安全功能。在目前市场的主流MCU当中,8位和32位是最大的两个阵营。
MCU市场稳步发展,预计年全球规模达88亿美元。在市场规模上,全球MCU市场呈现稳步发展的趋势,根据ICInsights估计,预计全球MCU市场规模从年的65亿美元达到年的88亿美元,CAGR达到5.17%,略低于同期汽车半导体增速。同时我国MCU发展与世界齐头并进,预计年市场规模达到56亿元,CAGR达到5.33%,与世界同期基本持平。
智能座舱SoC:高通在中高端数字座舱呈现垄断局面
一芯多屏不断普及,高通在中高端数字座舱呈现垄断地位。伴随着数字座舱渗透率不断提升,车内数量不断增加,屏幕尺寸不断增大,智能座舱快速普及,一芯多屏逐渐成为主流,也带动智能座舱SoC芯片的快速放量。SoC应用在智能汽车上主要有智能座舱以及自动驾驶两方面,相比于自动驾驶SoC,座舱域SoC由于要求相对较低,成为SoC落地智能汽车的先行者。高通、恩智浦、德州仪器、英特尔、联发科等各家不断更新其座舱SoC产品,在中高端数字座舱域,目前高通呈现垄断地位。目前,高通已经赢得全球领先的20+家汽车制造商的信息影音和数字座舱项目,高通骁龙A和两代平台成为众多车型数字座舱平台的主流选择,高通也将推出的第四代座舱SoCSA,在算力、I/O能力等方面表现出色,不断稳固其在中高端数字座舱的稳固地位。
自动驾驶SoC:CPU+XPU是当前主流,英伟达当前领先
自动驾驶芯片是指可实现高级别自动驾驶的SoC芯片。随着自动驾驶汽车智能化水平越来越高,需要处理的数据体量越来越大,高精地图、传感器、激光雷达等软硬件设备对计算提出更高要求,因此在CPU作为通用处理器之外,增加具备AI能力的加速芯片成为主流,常见的AI加速芯片包括GPU、ASIC、FPGA三类。CPU作为通用处理器,适用于处理数量适中的复杂运算。CPU作为通用处理器,除了满足计算要求,还能处理复杂的条件和分支以及任务之间的同步协调。CPU芯片上需要很多空间来进行分支预测与优化,保存各种状态以降低任务切换时的延时。这也使得它更适合逻辑控制、串行运算与通用类型数据运算。以GPU与CPU进行比较为例,与CPU相比,GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是很小的一部分。
“CPU+XPU”是当前自动驾驶SoC芯片设计的主流趋势。根据XPU选择不同,又可以分为三种技术路线:CPU+GPU+ASIC、CPU+ASIC以及CPU+FPGA三类。(1)“CPU+GPU+ASIC”,主要代表英伟达、特斯拉FSD以及高通Ride。英伟达Xavier和特斯拉FSD采用“CPU+GPU+ASIC”的设计路线,英伟达Xavier以GPU为计算核心,主要有4个模块:CPU、GPU、以及两个ASIC芯片DeepLearningAccelerator(DLA)和ProgrammableVisionAccelerator(PVA);特斯拉FSD芯片以NPU(ASIC)为计算核心,有三个主要模块:CPU、GPU和NeuralProcessingUnit(NPU)。
(2)“CPU+ASIC”,主要代表MobileyeEyeQ5系列和地平线征程系列。MobieyeEyeQ5和地平线征程系列采用“CPU+ASIC”架构,EyeQ5主要有4个模块:CPU、ComputerVisionProcessors(CVP)、DeepLearningAccelerator(DLA)和MultithreadedAccelerator(MA),其中CVP是针对传统计算机视觉算法设计的ASIC;地平线自主设计研发了Al专用的ASIC芯片BrainProcessingUnit(BPU)。
(3)CPU+FPGA,主要代表Waymo。与其余厂商不同,Waymo采用“CPU+FPGA”的架构,其计算平台采用英特尔Xeon12核以上CPU,搭配Altera的Arria系列FPGA。
目前各家发布的最新芯片平台均可以支持L3或L4级的算力需求,英伟达当前处于领先位置。英伟达单颗Orin的算力可以达到TOPS,而年落地的车型中搭载4颗Orin的蔚来ET7和威马M7其巅峰算力将超过TOPS,高通骁龙Ride平台的巅峰算力预计在-TOPS,Mobileye也推出了面向高阶自动驾驶的EyeQ6Ultra,算力达到TOPS,当前各家最先进的算力平台均可以支持L3或L4级的算力需求。从相关量产车型来看,英伟达Orin成为当下的主流选择,Mobileye正在逐渐掉队。
评价框架:芯片性能,算力、能耗、效率缺一不可
评估芯片的性能,一般采用PPA即Power(功耗),Performance(性能),Aera(面积)三大指标来衡量性能。而智能驾驶领域,峰值算力成为衡量自动驾驶芯片的最主要指标,常见的指标有TOPS、FLOPS、DMIPS三种:
TOPS(TeraOperationPerSecond):每秒完成操作的数量,乘操作算一个OP,加操作算一个OP。TOPS的物理计算单位是积累加运算(MultiplyAccumulate,MAC),1个MAC等于2个OP。TOPS表示每秒进行1万亿次操作。
FLOPS(Floating-PointOperationsPerSecond):每秒可执行的浮点运算次数的字母缩写,它用于衡量计算机浮点运算处理能力。浮点运算,包括了所有涉及小数的运算。MFLOPS(MegaFLOPS)等于每秒1百万次的浮点运算;GFLOPS(GigaFLOPS)等于每秒10亿(=10^9)次的浮点运算;TFLOPS(teraFLOPS)等于每秒1万亿次的浮点运算。
DMIPS(DhrystoneMillionInstructionsPerSecond):是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。MIPS:每秒执行百万条指令,用来计算同一秒内系统的处理能力,即每秒执行了多少百万条指令。不同的CPU指令集不同、硬件加速器不同、CPU架构不同,导致不能简单的用核心数和CPU主频来评估性能,Dhrystone作为统一的跑分算法,DMIPS比MIPS的数值更具有意义。
(1)智能座舱SoC:DMIPS衡量CPU算力的主要单位是DMIPS,基本上SoC高于20,DMIPS才能流畅地运行智能座舱的主要功能,如AR导航或云导航、全景、播放流媒体、ARHUD、多操作系统虚拟机等。GPU方面,GFLOPS的算力就可以支持3个P的屏幕。一般来说,CPU高于20,DMIPS,GPU高于GFLOPS的SoC就是智能座舱SoC芯片。(2)自动驾驶SoC:TOPS峰值算力体现的只是芯片的理论上限,不能代表其全部性能。自动驾驶需要的计算机视觉算法是基于卷积神经网络实现的,而卷积神经网络的本质是累积累加算法(MultiplyAccumulate,MAC),实现此运算操作的硬件电路单元,被称为“乘数累加器”。这种运算的操作,是将乘法的乘积结果b*c和累加器a的值相加,再存入累加器a的操作。TOPS=MAC矩阵行*MAC矩阵列*2*主频,TOPS峰值算力反映的都是GPU理论上的乘积累加矩阵运算算力,而非在实际AI应用场景中的处理能力,具有很大的局限性。以英伟达的芯片为例,Orin、Xavier的利用率基本上是30%左右,而采用ASIC路线,ASIC芯片针对不同的神经网络模型去优化,基本上可以做到60%~80%之间。
地平线提出最真实的AI效能由理论峰值计算效能、有效利用率、AI算法效率组成。地平线在全球人工智能和机器人峰会提出了芯片AI性能评估方式MAPS(MeanAccuracy-guaranteedPrecessingSpeed),地平线认为最真实的AI效能实际上由三要素组成,分别为理论峰值计算效能、有效利用率、AI算法效率。(1)理论峰值计算效能,TOPS/W、TOPS/,即传统理论峰值衡量的方法;(2)芯片有效利用率,把算法部署在芯片上,根据架构特点,动用编译器等系统化解决一个极其复杂的带约束的离散优化问题,而得到一个算法在芯片上运行的实际利用率,这是软硬件计算架构的优化目标;(3)AI算法效率,每消耗一个TOPS算力,能带来多少实际的AI算法的性能,它体现的是AI算法效率的持续提升。(报告来源:未来智库)
汽车软件研究框架
操作系统OS:QNX+Linux或QNX+Android是当前的主流趋势
在智能网联时代,车机操作系统OS(operatingsystem)按下游应用划分,可以分为车控OS和座舱OS两大类:(1)车控OS:主要负责实现车辆底盘控制、动力系统和自动驾驶,与汽车的行驶决策直接相关;(2)座舱OS:主要为车载信息娱乐服务以及车内人机交互提供控制平台,是汽车实现座舱智能化与多源信息融合的运行环境,不直接参与汽车的行驶决策。对于车控OS而言,可分为嵌入式实时操作系统RTOS和基于POSIX标准的操作系统。(1)嵌入式实时操作系统RTOS:传统车控ECU中主控芯片MCU装载运行的嵌入式OS,面向经典车辆控制领域,如动力系统、底盘系统和车身系统等。要求实时程序必须保证在严格的时间限制内响应,特点包括速度快,吞吐量大,代码精简,代码规模小等;(2)基于POSIX标准的操作系统:主要面向智能驾驶系统,主要满足其高通信和低延时的要求。
汽车电控ECU必须是高稳定性的嵌入式实时性操作系统,主流的嵌入式实时操作系统都兼容OSEK/VDX和ClassicAUTOSAR这两类汽车电子软件标准。嵌入式实时操作系统具有高可靠性、实时性、交互性以及多路性的优势,系统响应极高,通常在毫秒或者微秒级别,满足了高实时性的要求。目前,主流的嵌入式实时操作系统都兼容OSEK/VDX和ClassicAUTOSAR这两类汽车电子软件标准。欧洲在上世纪90年代提出了汽车电子上分布式实时控制系统的开放式系统标准OSEK/VDX。但随着技术、产品、客户需求等的升级,OSEK标准逐渐不能支持新的硬件平台。年,宝马、博世、大陆、戴姆勒、通用、福特、标志雪铁龙、丰田、大众9家企业作为核心成员,成立AUTOSAR组织,致力于建立一个标准化平台,独立于硬件的分层软件架构,制定各种车辆应用接口规范和集成标准,AUTOSAR是基于OSEK/VDX发展出来的,但涉及的范围更广。
AUTOSAR主要包括ClassicPlatformAUTOSAR(CP)和AdaptivePlatformAUTOSAR(AP)两个平台规范:CPAUTOSAR是基于OSEK/VDX标准的,广泛应用于传统嵌入式ECU中,如发动机控制器、电机控制器、整车控制器、BMS控制器等;APAUTOSAR基于POSIX,主要应用于自动驾驶等需求高计算能力、高带宽通信、分布式部署的下一代汽车应用领域中。
狭义OS仅包含内核(如QNX、Linux),广义OS从下至上包括从BSP、操作系统内核、中间件及库组件等硬件和上层应用之间的所有程序。QNX、Linux是目前常见内核OS,VxWorks也有一定应用。随着WinCE停止更新逐渐退出,OS内核的格局较为稳定,主要玩家为QNX(Blackberry)、Linux(开源基金会)、VxWorks(风河)。其中Linux属于非实时操作系统,而QNX和VxWorks属于实时操作系统,WinCE是微软开发的嵌入式操作系统,正在逐步退出汽车操作系统市场。(1)BlackberryQNX:QNX是遵从POSIX规范的类UNIX实时操作系统,是全球第一款达到ASILD级别的车载操作系统,优点是稳定性和安全性非常高,QNX依靠其微内核架构实现性能和可靠性的平衡,主要特点有内核小、代码少以及故障影响小,驱动等错误不会导致整个系统都崩溃,通用、沃尔沃、奥迪、上汽等均用QNX作为自动驾驶OS。但缺点是QNX作为非开源系统,兼容性较差,开发难度大,在娱乐系统开发中应用不多,主要是开放性不够,应用生态缺乏。(2)Linux(Android):Linux是基于POSIX和UNIX的开源操作系统,可适配更多的应用场景,具有很强的定制开发灵活度,主要用于支持更多应用和接口的信息娱乐系统场景。Android是谷歌基于Linux内核开发的开源操作系统,主要应用在车载信息娱乐系统、导航领域,在国内车载信息娱乐系统领域占据主流地位。由于其完全开源,基于Linux开发的难度也极大,而且开发周期比较长,这就限制了车机系统进入门槛。(3)VxWorks:VxWorks由WindRiver设计开发的嵌入式实时操作系统,以其良好的可靠性和卓越的实时性被广泛地应用在通信、军事、航空、航天等领域,VxWorks由多个相对独立的目标模块组成,但与Linux相比,VxWorks需要收取高昂的授权费,开发定制成本较高,这限制了其市场占有率的增长。
QNX、Linux是当前车机OS内核的首选。根据赛迪顾问的统计,QNX由于其典型的实时性、低延时、高稳定等特征,年QNX市占率达到43%,是当前市占份额最高的车机OS,已应用在包括宝马、奥迪、奔驰等超过40个品牌,全球使用了QNX的汽车超1.75亿辆;Linux(含Android)Linux版本丰富,经过改造Linux内核也将具备实时性功能,21年市占率35%;WinCE当前市占率8%,呈现快速下滑态势,未来可能将逐步在市场消失;VxWorks同时具备实时性及开源特点,但其业务重点一直在复杂工业领域,对于汽车产业投入较少,售价及维修费用极其昂贵,目前仅在部分高端品牌车型上有所尝试。
随着智能座舱和智能驾驶的进步,OEM厂商更加
转载请注明:http://www.0431gb208.com/sjszlff/2632.html