前言:接触过许多的车规级别的的芯片,在与上下游供应厂商相关技术人员沟通的过程中会有很多专业名词概念,第一次听说的都会感觉很懵,这里就简单介绍一下我所遇到的比较常见但是不太好懂的概念:内核异构,共因失效 ,锁步。


目录

1,内核异构

1.1 什么是内核异构

1.2 异构技术的发展

1.3 车规级芯片应用

 2,共因失效

2.1 共因失效的概念

2.2 共因失效在汽车电子行业应用

在车规级产品设计中如何应对共因失效?

3,锁步

3.1 什么是锁步

3.2 锁步系统的工作原理

3.3 车规级芯片中的锁步


1,内核异构

1.1 什么是内核异构

内核

内核就是一个计算处理单元,承担了常用的逻辑计算的功能,我们买电脑常听的CPU有几个核就是指的这个内核的概念。相较于计算机,MCU或者MPU中的核的数量非常有限,最常见的就是单核MCU,比如经典的STM32F系列的MCU。现阶段随着嵌入式技术的发展,MCU也出现了多核结构,特别是对于车规级MCU而言。

异构

从字面意思来看,异就是不同,构就是架构或者结构,所以异构其实就是“不同的结构”。它的反义词是同构,也就是“相同的结构”。如果你没听说过这两个词也完全没关系,其实在我们日常生活中关于异构和同构的例子是有很多的。就拿我们家里的装修和收纳举例,以前很多房屋装修都是同样的风格,看起来像是一个模子印出来的。收纳也很简单,比如厨房里都用一样的四四方方的橱柜,去收纳各种锅碗瓢盆。这其实就是同构。(本比喻借鉴自其他博主的分享)

总结来讲就是:

内核异构指的是在同一颗SoC/MCU芯片上集成了两个及以上具有不同架构/特性/性能的CPU内核,它们可以协同工作,也可以独立运行,执行各自适合的任务。

1.2 异构技术的发展

使用异构的一方面原因,其实是由于当技术发展到一定程度的时候,不可避免的遇到很多限制。很多年前,传统地提升CPU性能的方法,就是堆料,也就是不断增加CPU核心的数量,从而让性能随着核心数的增加而线性增加。多核架构在十几年前就是非常热门的研究方向,人们认为,只要能够编写和运行并行软件,就可以将处理器架构直接扩展到数千个核心。

当然了现实总是非常残酷。在之前的文章里介绍过,当时还在德州大学奥斯丁分校的道格博格尔教授写了一篇文章,研究并提出了所谓的“暗硅效应”。

图片

它说的是虽然可以不断增加核心数量,但由于功耗的限制,我们却无法让这些核心同时工作。这就像一个大楼有很多房间,但由于供电量有限,我们无法同时开启每个房间的灯,这就让这个大楼在夜里看起来有很多黑暗的部分,这也是暗硅这个词得名的原因。

暗硅效应的提出,完全改变了芯片产业发展的方向。人们意识到即使不断的堆核,并且开发出了并行软件,这种同构的方法带来的性能提升也会非常有限。所以异构计算就应运而生了。事实上,在计算机领域,异构计算是一个近年来非常热门的方向,就是因为异构计算能够充分利用CPU、GPU、FPGA、ASIC等等不同芯片结构的特点,相互取长补短,从而实现更加高性能低功耗的计算系统。

1.3 车规级芯片应用

车规芯片面对的系统挑战远大于通用消费类芯片,异构设计主要是为了解决以下需求:

需求 对应的内核选择
实时性(如电机控制、CAN/LIN) MCU核(如 RH850、Cortex-R、Cortex-M)
高算力(如ADAS、图像识别) MPU核(如 Cortex-A、RISC-V)
功耗优化 通过低功耗核在空闲或待机时维持系统最小功能

常见车规级的多核MCU有NXPi.MX8系列瑞萨RZ/T2HG系列以及TIAM62x系列等等

比如下面我找出了瑞萨的RZ-T2H系列芯片的系统框图,可以看到系统里面的CPU的内核构成,A55核与R52核同时存在就是经典的内核异构的范例。

 2,共因失效

2.1 共因失效的概念

共因失效与原本是电工中的术语,意思就是多个产品由单一原因引起失效。

后又扩展为两个或多个系统元件或子系统由于同一个根本原因(common cause)同时或近似同时发生失效的现象,导致冗余系统同时失效。

2.2 共因失效在汽车电子行业应用

现代汽车的安全性随着电气智能化技术的发展变得越来越高,就是因为其在底层系统设计的时候将很多可能出现的安全隐患都考虑了进来,比如共因失效的问题。

举个简单的例子:一个EPB制动刹车系统,可能需要用到两个控制系统,如果由于一个原因强磁场或者高温等导致两个系统同时失效,那么这个刹车功能就在宏观上面失效了,这对于车厂来讲是不可接受的。

上面这个例子就是共因失效的具体体现,要如何避免这种情况出现呢,就需要将这两套你系统的部件做的不一样,比如A系统使用a种芯片,B芯片使用b种芯片部件。

在车规级产品设计中如何应对共因失效?

1. 分离冗余资源

  • 不使用相同的 PMIC 为主备系统供电

  • 双核系统使用独立时钟源(有偏差容忍)

  • 冗余通信通道走不同布线路径

2. 隔离设计(Isolation Design)

  • 使用 Memory Protection Unit (MPU)MMU 隔离安全区域

  • 核间使用硬件中介(如 RH850 的 ICB)代替共享内存通信

3. 故障注入测试

  • 在开发中使用 Fault Injection Testing(FIT)测试系统能否抵御共因扰动

4. 安全机制交叉监控

  • A核监控B核状态,使用 Cross Monitor / Checker

  • 使用 独立安全岛(Safety Island) 来检测主系统状态

3,锁步

3.1 什么是锁步

锁步是指两颗或多颗处理器核心同步执行相同的指令流、处理相同的数据,并实时比较结果,以确保运算正确性。一旦检测到两者结果不同,就认为出现故障,立即触发安全机制(如复位、降级、进入安全状态等)。

锁步(Lock-step)是一种在汽车电子等高安全系统中广泛采用的冗余技术,主要用于提升系统容错能力、检测计算错误,是实现 功能安全(ISO 26262) 尤其是 ASIL D 等高等级安全目标的关键手段之一。其再细分的话就是属于冗余技术体系中的一种针对于车规级芯片的一种保障汽车安全的技术手段。

优点 缺点
实时错误检测能力强 成本高(双核+比较器)
符合ASIL D 安全需求 功耗高(两核一直运行)
不依赖软件检测机制 开发复杂性增加
响应快,适用于硬实时 某些应用下灵活性差(同步太强)

3.2 锁步系统的工作原理

组件 描述
主核(Primary Core) 正常运行程序
从核(Lock-step Core) 与主核完全同步运行同样的指令
比较器(Comparator) 每周期或每指令级比较两核结果
错误处理机制 出现不一致时报告错误并处理(如中断、故障模式)

3.3 车规级芯片中的锁步

在汽车电子系统中,ECU控制器、ADAS、动力系统、电刹系统等安全关键场合,需要极高的系统可靠性,因此常使用锁步技术。其实也就是这些汽车零部件使用的计算芯片包含的锁步技术。

常见的有瑞萨RH850/F1KM、RH850/U2A与英飞凌TC3xx AURIX 系列。

比如下面我们查看瑞萨官网中的关于RH850U2A的系统框图就是4核加上4锁步。

参考资料:

异构计算,只是大小核罢了?

A核与M核异构通信过程解析 - 知乎

RZ/T2H - 先进的高端 MPU,集成了强大的应用处理功能和高精度实时控制性能,高达 9 轴电机控制 | Renesas 瑞萨电子

 安全性评估中的共因失效、共模失效 - 知乎

018 锁步核(Lockstep Core) - 知乎

Logo

智能硬件社区聚焦AI智能硬件技术生态,汇聚嵌入式AI、物联网硬件开发者,打造交流分享平台,同步全国赛事资讯、开展 OPC 核心人才招募,助力技术落地与开发者成长。

更多推荐