天际9000 | 型号制造过程 | 4纳米 | 架构
1*3.0GHz X2超大内核
3*2.85GHz大内核 4*1.8GHz小内核 |
马里-77国集团MC9 |
按照惯例,我们先来看看天机9000的一些基本参数:
制造工艺:TSMC 4nm;;
CPU:1x Cortex-X2 3.05 GHz+3x Cortex-A710 2.85 GHz+4x Cortex-A510 1.8 GHz;
GPU:Mali-G710 MC10;
AI处理器(APU): 4x性能核+2x灵活核;
Isp: imagiq gen7,支持最高9gb pixel/s吞吐量,3.2亿像素摄像头;3核3 EXP HDR-ISP(支持3个3200像素摄像头,全系统处理能力270fps,18bit流水线);4 K-EXP视频HDR支持;AI-视频架构;
视频显示:8K视频编解码器,支持8K AV1视频播放;输出支持高达WQHD+ @144Hz/FHP+ @180Hz,HDR10+自适应支持;
调制解调器:5G Rel.16,支持下行载波聚合3CC,最大带宽300MHz (3x100MHz),速率7Gbps上行链路R16 UL增强;UltraSave 2.0省电功能支持;
其他连接:WiFi 6E(6 GHz);5.3蓝牙;完整的GNSS支持;
内存支持:LPDDR5x-7500;;
他们有很多 全球发布 ,包括首款TSMC 4nm制造工艺、首款Cortex-X2 IP、首款Mali-G710 IP、首款LPDDR5x 7500、首款32000万像素摄像头、首款3-cam 3-exp 18bit HDR、首款8K AV1视频播放支持、首款5G下行3CC载波聚合300MHz 7Gbps实现、首款R16 UL增强支持。
整体来看,在这个时间节点下,大部分配置还是相当豪华的,至少天机9000的旗舰定位是毋庸置疑的。对于每一个组成部分,我们都切开来说一下。
CPU的一部分:第一个Armv9实现
从发布时间来看,这确实是市面上最早采用Armv9指令集的处理器。
在以前的文章中已经详细描述了对皮质-X2/A710/A510的分析。
这三个IP都是Arm在今年年中向公众发布的。它们的亮点是都基于Armv9指令集,基本上切断了对32位AArch32执行模式的支持(除了针对中国市场的Cortex-A710)。
1+3+4的配置从之前的Cortex-X1开始就很常见了。
据说Arm Cortex-X2在IPC中比X1高16%;与上一代Cortex-A78相比,A710的同频性能提升了10%(并且在同等性能下功耗降低了30%);小核A510的提升应该是最大的,相比老款A55性能提升35-50%,峰值性能有20%的功耗红利。
CPU核心更具体的架构变化这里就不描述了。
特别值得一提的是,天机9000对CPU缓存进行了提升:L3缓存容量提升至8MB,而整个SoC上几大IP的SLC(系统级缓存)容量提升至6MB。
所以,联发科在发布会上宣布,移动CPU架构的缓存已经实现 PC级缓存设计 ,达到 14MB mdash mdash虽然我们觉得添加L3缓存和SLC很奇怪。
这种容量变化其实并不奇怪。以前,当Arm发布Cortex-X2时,推荐的L3缓存是8MB。
此外,正如我们在分析文章中提到的,8MB L3缓存是提高Arm新IP性能的关键。
6MB的SLC在安卓阵营中算是比较大的了。
相对来说,高通骁龙888的L3缓存是4MB,而SLC是3MB。不过还是比不上苹果(A15的SLC达到32MB)。
联发科表示,14MB的缓存系统可以帮助提高高达7%的性能,减少25%的带宽消耗。
在宣传中,联发科还对比了14MB和英特尔酷睿处理器(笔记本用)的容量,如上图所示。
如果是第11代酷睿,这里列出的i7处理器的12MB缓存应该是指LLC(特指L3缓存)。
这个比较其实并没有那么公平和有意义:一方面,英特尔酷睿处理器的L2缓存其实会更大;另一方面,x86平台的缓存系统设计和Arm阵营的不太一样。比如L3缓存在系统中的作用不同(x86端没有SLC),x86端L1缓存也不可能有当代Arm那么大。
此外,天机9000的Cortex-X2大核L2缓存也配备了1MB,A710的L2缓存为512KB。这些都是Arm推荐的配置更大档位的方案,也能说明天机9000的旗舰定位。
联发科提到天机9000 相比现在的安卓旗舰,峰值性能提升高达35% ;, 同时,能效最高可提高37% ; mdash mdash这主要是关于X2皮层。
这个说法还是比较模糊的,具体比较对象不明。
考虑到4nm工艺红利和Cortex-X2的架构提升,相比X1仍然难以实现35%的性能提升。
联发科给出了具体的基准对比。这里35%是基于SPECint2K6的测试,系统级性能提升。
核心层面,Geekbench 5.0实测天机9000单核性能提升10%。
相比之下,Arm之前在发布会上提到,Cortex-X2基于SPECint2K6测试,IPC比X1最高提升16%。
所以天机9000的具体实现还是挺值得后续观察的。
当然,我们不知道联发科在这里具体对比的是谁。
多核CPU性能方面,联发科表示天机9000在Geekbench 5.0中得分超过4000分。
除了上图中的对比 安卓旗舰 外面,中间两个 022旗舰 还有 020旗舰 代表应该是iPhone(因为演讲者在他的演讲中说,所以我们不仅要比较今天的Android时尚,我们还要比较非Android手机,即Cupertino公司制造的2020版和2022版。)
这个性能确实不错,但是苹果A系列的强项其实主要在单核性能上;而且请注意,天机9000的手机要到明年才能正式上市。
但另一方面,与所谓的 安卓旗舰 跑分高那么多,真的是相当辉煌的成绩。
体验方面,联发科给了不同app在天机9000平台下的启动时间,而 安卓旗舰 速度对比。其中,网飞的启动时间快了55%,游戏应用等一些重负载的启动速度也提高了12%-50%。
GPU:好像支持光追。
GPU方面,天机9000选用的Mali-G710是10核。其实Arm发布Mali-G710的时候就提到过有7-16个可配置的着色器核心。
具体性能取决于未来产品发布时的核心频率等各种因素(LPDDR5x 7500支持这里应该有帮助)。
上一篇文章没有提到的是,联发科在会上略微提到了Tenji 9000。实现了光线追踪功能,为移动终端带来PC级的游戏体验 ,但没有谈更多的信息。
在不久前联发科举办的媒体分享会上,提到了光线追踪实现的进展。
不过据我们所知,Mali-G710并没有硬件级的光线追踪支持 mdash mdash至少没有专门用于光学跟踪的加速硬件。
我们猜测天机9000基于Vulkan API的光线追迹支持还是软件层面的。
不过,联发科此前曾提到,已经开始在硬件层面(如缓存/缓冲区等)布局对未来最终光追硬件实现的逐步支持。).猜测天机9000也是联发科实现完全光学追求硬件支持的重要一步。
在性能提升方面,联发科表示相比2022年天机9000的Mali-G710 GPU ;安卓旗舰 高达35%的性能遥遥领先,而能效高达60%。对比不清晰,无法做出确切判断。
具体连续游戏性能方面,联发科给出了上图。
这张图测试的是某款 热门沙盒游戏 60fps设置,开启5G网络,连续播放24分钟,帧率的变化。注意这张图的对比对象可能是iPhone 13,联发科在会上也提到了对比游戏是原神。
从这张图可以看出,天机9000的游戏帧率会更稳定,由于发热限制可以坚持的帧率会略高。
不过这个比较其实是考验系统的性能,包括OEM厂商的散热设计,会占非常大的比重。
上图比较了更多类型的游戏,这里 022旗舰 这看起来很奇怪......但如果主流游戏都能跑满帧(以及平均帧率),无论竞争对手是谁,天机9000对于游戏玩家来说确实值得期待。
在这部分,还值得一提的是天机9000支持LPDDR5X7500mt/s。
其中提到,与LPDDR5 5500相比,联发科LPDDR5x 7500在重负载下可以提升36%的带宽,降低20%的延迟。
而且去年的旗舰手机和今年的旗舰手机确实大多都在用LPDDR5。
LPDDR5x仍然是一个相当新的解决方案。三星在本月初刚刚宣布开发出首款14nm 16Gb LPDDR5x DRAM。
之前三星给出的数字是比LPDDR5快1.3倍的处理速度,低近20%的功耗。
这几天美光刚刚宣布联发科验证了其LPDDR5x DRAM,针对天机9000。
美光的数字是,LPDDR5x的峰值为8.544Gb/s,比LPDDR5的峰值最高提升了33%。
理论上,LPDDR5x的采用应该也是游戏帧率提升的一部分原因。
AI性能:与苹果和谷歌相比
当代手机SoC不可忽视的另一个亮点自然是AI core。联发科称自己的AI核心为APU。
这也是联发科自研IP的重要组成部分,或者说APU成为了联发科在手机SoC市场差异化竞争的关键。
在最近的媒体分享报道中,我们也特别提到了联发科对AI的看法,以及联发科的 有效计算力每瓦 要判断AI处理器的性能和效率,推荐关注端侧AI推理的你看一下。
这款天机9000中的APU采用了四个性能核心和两个柔性核心。简单理解应该是四大核两小核的设计。上一代产品,联发科用的是2核+3核的方案。所以联发科宣称天机9000的AI性能提升高达400%,同时功效也提升了4倍。
似乎大部分端到端的AI芯片或者IP供应商都很少提到自己的芯片架构,联发科在会上也没有谈到自己的APU架构。
与 022旗舰 (这个应该是指iPhone——又是Cupertino公司),AI性能领先66%,能效领先31%。以下是一些具体应用与NN的对比:
物体检测和图像分类确实是手机上有代表性的AI应用场景,运行在MobileDet、MobileNet V3和V2的网络上。
此外,联发科还将天机9000的APU与谷歌不久前发布的Pixel 6手机上的张量处理器进行了对比。对比AI ETHZ v4 mdash mdash苏黎世联邦理工学院的AI Benchmark也是业界知名。
联发科表示,相比Tensor,天机9000在AI性能上有高达16%的性能领先。
更具体的对比项目见上图,包括视频AI降噪、去模糊等等。
ISP、媒体和显示器
手机的SoC上,除了CPU、GPU、AI核,芯片厂商普遍强调ISP(图像处理器)。毕竟图像性能是下游手机产品的推广重点。天机9000也不例外。
天机9000以上的ISP是联发科第七代Imagiq。联发科称之为全球首款3.2亿像素的ISP,吞吐量为9 GigaPixel/s/s,相比上一代,这款新ISP据说是流水线上完全的重新设计。
与上一代相比,这一代ISP的吞吐量提升了2倍,视频降噪性能提升了10倍。
视频拍摄支持包括4K HDR拍摄和人工智能视频架构。
我们的ISP是3核(3 ISPs)设计,每个ISP(核)可以处理3张曝光的图片(应该是指3张不同曝光的帧或图片)。然后说到视频拍摄,在HDR模式下可以同时拍摄3张曝光的18bit视频(联发科说Imagiq Gen 7是全球第一个可以在ISP流水线上实现18bit的方案)。联发科称其为全球首款硬件级3-cam 3-exp 18位视频HDR支持。如果三个ISP(核心)一起工作,他们将每秒处理270帧。
对于所谓的3曝光,联发科也在会上与2曝光方案进行了对比。
联发科表示,3次曝光输出的18位HDR画面更接近人眼的动态范围(这个对比应该是指视频拍摄的每一帧都经过3次曝光的HDR合成)。
当然,ISP和AI的合作是现在手机SoC芯片厂商普遍在做的事情。
毕竟,AI在图像拍摄中发挥着越来越重要的作用。前面提到的AI-Video架构应该是联发科的解决方案。
天机9000主要强调有一个VSE(视频流引擎) mdash mdash这是架构层面的进步。 ISP与APU合并的流程处理 , 拍摄视频或处理大幅照片时,不再需要通过DRAM频繁交换数据 。
联发科没有提供更多关于这款VSE的信息,可能与增加片上缓存有关。之前我们在《手机摄影:一亿像素在AI面前都是垃圾》一文中谈过。麒麟9000采用了智能缓存和帧切片来实现ISP和NPU之间的数据交换,避免了通过片外存储频繁读写数据。我猜VSE可能与此类似。
联发科表示,VSE可以降低高达17%的功耗和高达33毫秒的延迟,这将使实时视频记录和处理具有更多功能。
这种计算能力和架构是达到照片和视频质量的基础。然而,由于原始设备制造商采用的算法,在ISP层面上创建图像内容更为重要。
内容呈现与SoC上的显示器和媒体/视频编解码模块相关。
视频方面,天机9000支持8K视频编解码,包括8K AV1格式视频播放。联发科表示,现在很多视频流媒体服务已经升级到AV1。
所以要把它固化成模块。
显示方面,天机9000支持2K分辨率屏幕,最高刷新率144Hz,或180Hz全高清分辨率屏幕显示,支持HDR10+自适应。
浅谈5G modem和天机9000的低功耗
在连接支持上,天机9000将WiFi支持的带宽翻倍至160MHz。
这次对WiFi 6E的支持应该是真正160MHz带宽的组成部分。另外,天机9000是智能手机中第一款支持蓝牙5.3的芯片 mdash mdash估计降低蓝牙耳机的延迟是对用户更有价值的应用场景。
至于无线连接的5G支持,虽然这款天机9000还是不支持毫米波,但是开始支持sub-6GHz下行的3CC载波聚合,带宽300MHz,最大带宽7Gbps mdash mdash今年9月,DeTech宣布了与联发科在这方面的合作,即在sub-6GHz范围内,聚合三个5G NR载波,实现300MHz的带宽。
此外,还支持更多5G Rel-16特性,包括 全球首款R16 UL增强版 与Rel-15相比,弱信号区域的上行速度最高可提升3倍。这些特性是联发科技术投入的重要组成部分。
对于5G支持,联发科的另一个重点是不断加强UltraSave技术。天机9000用的是UltraSave 2.0的迭代版本。
联发科表示,相比 022旗舰 (iPhone),在连接模式下可降低高达32%的功耗,在高速模式下可降低高达27%的功耗。
在联发科的定义中,这里的高速模式似乎在于高速使用5G流量的视频流等典型应用。如何省电,联发科在发布会上只字未提。
说到低功耗,联发科CEO蔡崇信(Rick Tsai)的这篇演讲已经提到了联发科的 。低功耗 值,别忘了在演讲的开头、中间和结尾都要提到 低功耗 需要强调的是,在技术上从低功耗转向高功耗将比从高功耗转向低功耗困难得多。毕竟联发科家在边缘和端侧设备,IoT也是其重要市场。追求低功耗也是合适的。
对于天机9000,联发科表示:我们采用新技术和新的低功耗架构,将功耗控制在最低水平。
上一组的比较也是 安卓旗舰 。
具体场景包括飞行模式、空空闲模式、音乐播放、8K视频播放、4K视频录制、游戏等。在不同的场景下,天机9000可实现的功耗相比竞品有不同的优势。但是像8K视频播放这样的场景和新加入的解码模块有关。
此外,联发科现在在制造旗舰手机SoC芯片方面有一个特殊的优势,即TSMC在技术上将明显更加成熟。
N4虽然不是大版本迭代,但TSMC在规划中会将其列为主流SoC的重要制造工艺。这在上一篇关于技术的文章中也有介绍。
三星4LPE实际上可能有更大的不确定性,因为4LPE目前是7LPP之后的完整迭代,包括音高缩放。这将是联发科明年与高通竞争的重要优势。
手机SoC是其他业务的重要驱动力。
天机9000无疑肩负着联发科全面征服高端手机市场的使命,所以联发科在这上面投入了大量的技术和心血。而且之前的媒体沟通会也可以清楚的看到,联发科在技术上的持续投入,以及未来手机芯片的规划路线,包括5G、AI、图形图像技术,之前都有过解读。似乎也是从这些年开始,联发科在技术上的投入和合作更加积极。这是把市场扩大到旗舰设备的关键。我们也期待明年天机9000发布后,看到市场交付的答案。
有意思的是,本次大会问答在环节A中,很多人问到联发科未来业务的发展重点,以及除了手机以外的其他业务的投入。陈和Rick Tsai解释说,联发科业务的其他增长点已经开始出现:虽然手机芯片业务的增长仍然是最快的,但其他组件的增长也同比增长30%至40%。
更重要的是,旗舰手机SoC 是我们技术的驱动力 联发科在手机上的很多技术储备正在以更快的速度流向其他应用和市场。包括 我们在先进技术和封装技术方面的能力也在其他计算业务中发挥作用 。这也为联发科的发展创造了更多的机会。