自从英特尔公司联合创始人戈登·摩尔在上个世纪60年代提出"摩尔定律"以后,这个定律目前已经被推断可适用于所有技术,包括智能终端在内的产品。例如以智能手机为例,目前业界普遍相信技术进步的速度应该每两年提高一倍,而实际上这一定律也确实得到了广泛验证。
回望2013年的移动终端界,可以确认这是一个极其重要且具有承上启下意义的时间节点。在当年,苹果推出了全球首款64位手机处理器A7,震动业界。而另外两家同属安卓阵营的亚洲芯片设计巨头联发科和三星公司则是共同将安卓移动终端带入了八核心处理器时代,安卓设备性能的飞速提升也从这个时期开始了。
八核处理器对于手机算力的提升是用户有目共睹的,但是在当时的手机技术宅用户群体中,他们更想要了解的是,刚刚问世的八核处理器到底在使用中表现如何?所以在此之前,我们有必要从全球首款"4+4"八核处理器,也就是第一代大小核芯片三星Exynos 5410这款芯片说起。
自从三星在2013年CES上发布这款主打高端市场的Exynos 5 Octa(Exynos 5410)处理器之后,业界围绕着其真假八核的争论就从来没有停止过。它的出现让原本就甚嚣尘上的"多核无用论"备受争议,而这种讨论在技术宅用户中持续的声音最广。
作为第一款打着八核的芯片,三星Exynos 5410可谓备受争议。(图/网络)
如今我们回过头去看,其实三星Exynos 5 Octa处理器并不是三星自己原创的架构,而是ARM提出的big.LITTLE架构设计在三星平台的第一次实际展现。所以你可以看到Exynos 5 Octa采用四颗A15大核心来作为"超高性能"的代表,并配备四颗A7小核心同样代表"节能功耗",二者通过ARM的CCI-400互联,根据工作负荷的大小来进行切换。
这样带来的后果就是,当年的exynos 5410处理器虽然号称是使用了豪华阵容的八个物理核心,但受限于ARM公版授权方案的设计初衷,无论你怎么进行调度,核心运作时最多能展现在用户面前的就只有四颗核心。而当时争议的焦点在于,Exynos 5410的大小核调度模式,一度让花了高价买三星旗舰机型的技术宅消费者觉得无法接受。
图为三星exynos 5410内部的结构设计图。(图/网络)
不过从现在来看,大小核运作的方式已经被消费者逐步接受,并且其优点也逐步显现。例如你在视频播放、文档处理、上网冲浪这些所谓的轻度应用时系统会将工作分配和小核心,达到节能省电的效果;但你进入大型游戏、高清录影等模式时则会切入大核心的模式,这种调度其实就是如今集群迁移调度的雏形,也就是所谓的"4+4"模式,这种调度模式在之后高通的骁龙835,甚至苹果的A10 Fusion下都能找到他的影子。
不过作为第一代大小核产品,在当时由于制程工艺的落后和ARM高性能核心的功耗,再加上总线吞吐量等问题的制约。用户再进行不同场景,不同强度应用的时候,频繁的进行大小核心的切换,反而带来了巨大的延迟,造成用户体验的崩塌,当时可谓是空有最强公版A15的性能,却败于调度模式,因此本质上这种调度方案仍是让设备以四核心的方式在运作。
联发科MT6592以HMP方案实现了八核全开,成为首款真八核芯片。(图/网络)
而之后由联发科技推出的主打中端市场的MT6592却以支持异构多处理(Heterogeneous Multi-Processing/HMP)方案受到中端用户的好评,相比三星的big.LITTLE架构,它通过并行处理器技术,可同时运行所有的八个核心,并提供核心配置和软件整合方案支持,确保每个核心独立灵活地运转。
此种调度方式复杂度比简单的集群迁移模式要高好几个数量级,需要系统内核调度器能够辨别多核心的存在与不同,智能地将负载分配给八颗核心,而且切换的延迟要非常低,从而发挥全部核心的最大能效能。在当时,MT6592虽然只是一颗定位于中端的手机处理器,但是却在核心调度方案上使用了当时旗舰机型都没有使用的HMP模式,让用户在多场景使用中体验到设备高能效的流畅体验。
当然实际上这也是ARM公版大小核架构的最新功能,不过有了新技术的加持和内部的优化,联发科后续还推出了首款真八核4G LTE芯片MT6595,成为当年红极一时的明星产品,而联发科的"真八核"也成为之后很长一段时间IC厂商争相角逐的标杆。
时至今日,消费者对核数之争已经有了理性的认知,更多的关注点落在了核数之间的分工协作上。而处理器的架构也从大小核分工、单核大小频率协作、多丛集设计方案演进,例如近日海思980就搭载了 ARM的 DynamIQ 调度特性,虽然华为官方将其称之为Flex-Scheduling多核智能调度机制,但本质上就属于多丛集的协作过程。
图为海思980使用的多核调度机制,使用2xA76+2xA76+4xA55设计(图/网络)
我们可以直观的看下,海思980的架构主要分为三部分,其中A76的核心又分为两组,分别是两颗最高主频为2.6GHz的运算部分,负责提供高性能运算;两颗主频为1.92GHz的能效比部分,负责日常的大部分应用。最后四颗则是主频为1.8GHz的A55小核心,负责低负载的应用,提升续航能力等,整体上是属于三档能效架构混合组成。
海思的这个架构其实很有意思,它可以针对不同的运算需求分配不同的核心去执行,能够将性能均衡分配,当然续航效果也更优。另外海思980的这个方案虽然很有亮点,但对手机芯片产品有关注的朋友其实不难发现,当年主打十核的联发科Helio X20其实也使用了类似的多丛集方案。
当年联发科Helio X20率先打出10核可谓是震惊业界,但我觉得它的最主要亮点反到不是在十核方面,而是提出了三(多)丛集的概念。联发科X20通过MCSI互联总线把这个十核进行连接,形成三丛集的核心群,然后这三核心群再通过联发科自研的CorePilot 3.0技术进行实时调控。
我们注意到CorePilot 3.0的技术文档中有一个Square的排前算法,简单来说就是这个算法会考虑到应用的类别,对应用的特性有一个实时的学习,从而知道这个应用对性能的需求程度,再调用相对应的核心去进行运算,在这个调用的过程中,不同丛集的核心是可以搭配互相使用,例如可以两大四小、可以四中四小,主要还是要依据当前处理器的状况以及应用对运算的需求。
例如你在使用手机看电子书、回邮件、听音乐的时候,系统就会主要启动小核心进行工作;而你在持续微信聊天、看电影、上网冲浪的时候,具备更高性能的中核心则会负责这部分的运算。至于在开启大型游戏、极限预算的时候,大核心则会加入工作,并且在不同的使用场景下,不同的核心数都能参与进来,所以网络上此前调侃的"一核有难,九核围观"实际上给联发科处理器带来了莫大的冤屈。
伴随着AI人工智能、大数据、5G网络的到来,消费人群在移动终端体验上已经有更加多元化的需求,例如智能手机方面的AI特性、多摄方案、全面屏等功能已经代表着次世代移动终端的发展方向,而在用户对设备提出更高强度的使用情况下,处理器的调度模式显得更加重要,这也对各家移动终端厂商调试处理器的技术提出了更高的要求。
联发科此前被吐槽为"一核有难,多核围观", 所以这一点上我们依旧来看看联发科的做法。以联发科目前最热的Helio P60来说,不仅处理器运算性能上早已经可以实现八核全开,破除了"多核围观"的迷思,而且最关键的是联发科已经开始朝着分工协作的思路演进,例如P60就集成了双核APU(AI处理单元),一开始就让AI处理器进入了多核的时代。当然这确实是出彩的一部分,但我倒觉得联发科思路更正确的则是持续演进其NeuroPilot AI技术,让手机芯片和AI的结合更近一步。
关于联发科的NeuroPilot技术其实网络上已经有很多分析,简单来说它是联发科把CPU、GPU以及自主研发的APU(AI处理单元)等异构运算功能整合到SoC中的技术, 其中APU还可以进一步扩展到多核,而NeuroPilot平台则会根据不同的场景和实际需求来进行运算的合理分配,实现专核专用、续航功能持续提升的特性,从根源上解决了网络传言的"一核有难,多核围观"的尴尬情况。
当然还有一点就是,联发科还提供NeuroPilot SDK,完整支持安卓神经网络API,不仅可以让开发者可以更贴近硬件的方式进行编程,提高性能和功能,还可以方便系统各个硬件的分工协作,也将系统优化从以往的CPU层面扩展到各种专用核心,进一步优化了效率和功耗。
联发科目前有多款芯片已经使用NeuroPilot技术,例如Helio P60、A22,此外最新发布的Helio P70也同样沿用这一思路,其自带有APU专核,AI处理效率进一步提升,此外还支持拍照美颜、人脸识别、场景优化、景深预览等,甚至实现了人体姿态识别这样的功能。
当然不可否认的是,随着手机处理器的性能瓶颈逐渐到来,以及手机芯片制程工艺的红利不复,各大芯片设计厂商也开始研究如何突破"摩尔规律"的限定,而AI显然成为接下来一段时间的重心所在,联发科目前在核心数这条路上确实找准了方向,大胆布局ASIC(专用集合电路)机制的AI专核,两代产品已经打出一些成绩。而在AI的推动下,据悉包括苹果、三星、海思等产品未来都可能会具备AI专核,打破多核迷思,逐步演进为专核专用将会是业界未来的主流思路。
从目前联发科的布局来看,其AI已经从智能手机延伸至智能穿戴、多媒体影音、智能家庭以及更广泛的万物互联设备等,而联发科也在持续与多家中、美技术业者结盟,包含腾讯、旷视科技、商汤科技、虹软等,整体前景值得看好,这家低调的华人企业在IC领域持续推进科技的普惠,这也是笔者最欣赏的部分。
|