英特爾18A首秀!Panther Lake重塑AI PC體驗:CPUGPU性能暴漲50%!
關鍵詞: 英特爾 Intel 18A Panther Lake AI PC 異構協同

盡管遭遇重重挑戰,但在“Make Intel Great Again”的目標牽引下,英特爾正重新踏上復興之路。
新CEO治下的藍色巨人,內部經歷大刀闊斧的變革,外部展現合縱連橫的開放。而即將在今年Q4量產的Inte 18A,則成為其在產品和技術創新側的奮力一搏。
日前,英特爾在美國亞利桑那舉行的“Tech Tour ”活動上,宣布推出由Intel 18A工藝打造,代號“Pather Lake”的新一代AI PC芯片架構。
Intel 18A代表著當前集成電路領域先進工藝和晶圓制造水平的天花板,作為全球首個利用Ribbon FET和背部供電的工藝節點下的首款產品,Panther Lake憑借性能、能效、AI能力等方面的全方位提升,推動AI PC體驗的重塑,而英特爾也借此“秀出肌肉、擊碎質疑”,引領晶圓制造進入全新時代。
靈活可擴展:Panther Lake的架構雄心
Panther Lake繼承了前兩代Lunar Lake和Arrow Lake在架構方面的創新,以及所帶來的能效和性能上的表現,英特爾為Panther Lake在架構設計上賦予了極大的靈活度。

Fabric Gen2是英特爾在Lunar lake上推出的新一代片內部互聯技術,主要用于連接計算模塊(Compute Tile)與平臺控制模塊(Platform Controller Tile),以及模塊內部各功能單元(如 CPU、GPU、NPU),其核心目標是在低功耗與高效通信之間取得平衡。
同時,通過統一的可擴展協議,Fabric Gen2可以CPU、GPU、NPU等核心IP模塊無需與制造和封裝工藝綁定,而是可以根據需求實現“混搭”,從而突破單一制程和IP體系的限制,這極大增強了架構上的可擴展性和靈活度。

Panther Lake繼承了Arrow Lake上獨立GPU模塊的設計思路(Lunar中GPU位于計算模塊中),計算模塊與GPU模塊通過D2D連接,這為GPU的Xe內核的更新以及數量增加提供便利,也有利于未來實現跨廠商的GPU IP模塊集成。

Panther Lake的架構包括計算(集成主要的計算引擎)、GPU、Base、Filler、平臺控制(所有I/O接口IP)、Foveros(Foveros 2.5D封裝)和Package等主要的模塊。

在存儲方面,采用板載內存的形式,Panther Lake支持LPDDR5X最高9600MT/s以及最高96GB的容量,DDR5最高支持7200MT/s以及最高128GB的容量。
在封裝技術方面,Foveros-S(2.5D封裝)是英特爾目前在Meteor Lake、Arrow Lake和Panther Lake等產品中正在使用的技術。所有產品均采用同一封裝形式,也便于客戶進行產品設計。

整體而言,Panther Lake在架構上的靈活性,為平臺設計提供更多選擇。這有助于Panther Lake作為一個長周期節點(至少三代產品,英特爾預計在2030年達到產能和需求的高點)在后續演進上的迭代,為OEM推出跨越不同價格段的產品在設計上預留足夠空間。此外,這種靈活的設計方式也有助于同更加開放的英特爾代工戰略協同,吸引外部客戶參與其代工生態。這也是為何英特爾對于Panther Lake強調“架構雄心”的意義所在。
在Panther Lake的計算模塊,采用的Intel 18A工藝,而對于其他模塊則采用外部工藝、Intel3等,對此,英特爾公司客戶端計算事業部副總裁兼中國區總經理高嵩解釋稱,在選擇制程時,會權衡價格、實現時間、團隊具體安排等多種因素,英特爾會根據產品需求,靈活選擇代工服務和制程。
Intel 18A:達到量產良率
英特爾18A工藝(1.8 納米級)作為其IDM 2.0戰略的核心技術突破,不僅承載著英特爾重返技術領先地位的厚望,更有望通過技術創新和戰略布局重塑全球半導體競爭格局。
Intel 18A是全球首個利用Ribbon FET和背部供電的工藝節點。
RibbonFET 全環繞柵極(GAA)技術實現了晶體管架構的顛覆式創新。通過垂直堆疊的納米帶(Nanoribbons)結構,Ribbon FET實現三維電流控制,相比傳統 FinFET,門電路控制能力更加優秀,驅動電流增強20%,開關速度提升15%,漏電率降低30%。這種設計使晶體管尺寸進一步微縮至1.8 納米級,芯片密度較Intel 3工藝提升30%,能效比提升15%。同時,對于芯片設計而言也更具靈活性和擴展性。
Intel 18A的背部供電技術,則是業界首個將供電網絡完全轉移至芯片背面的量產方案。實現了超過10%的芯片密度提升,同時使封裝到晶體管的IR drop(壓降)減少30%,帶來更好的能耗表現。同時,Intel 18A通過集成背部供電技術,帶來了更優秀的成本控制。同intel3相比,在EUV光刻過程中,可以使光罩數量減少44%,步驟減少42%。
得益于Ribbon FET和背部供電技術,Intel 18A相比于Intel3,每瓦性能提升15%,芯片集成度提升1.3倍,功耗降低25%。
對于Intel 18A的良率一直是外界關心的話題,在此次活動上,英特爾也對此進行了回應。按照英特爾的說法,Intel 18A的良率接近甚至超過過去15年的關鍵技術節點,已達到量產良率水平。10月9日,英特爾亞利桑那州的FAB52工廠將實現滿載運營,Panther Lake今年Q4也將實現量產。
針對不同類型芯片設計要求,英特爾選用不同封裝技術組合,其中包括EMIB、Foveros and Foveros Direct等。
Foveros屬于靈活的的chiplet封裝技術,能夠適應不同產品需求變化。針對不同芯片面積和設計周期能夠靈活拓展。Panther Lake采用的是Foveros-S,經過多年發展,更加成熟,此次Panther Lake系列的所有產品均采用同一封裝形式,便于客戶進行產品設計。
三箭齊發:GPU性能大漲50%
Panther Lake通過采用新的核IP。包括代號為Cougar Cove的P核和代號為Darkmont的E核和LPE核,均為18A特別設計和優化,能夠以低功耗實現高性能,同時也對IPC進行了額外的優化。

此次推出的Panther Lake系列包括三款不同的配置,其中8核、16核版本最高支持4核Xe GPU,而16核(12Xe)版本最高支持12個Xe核。
從目前配置策略看,8核版本應為面向普通商用市場,16核(4核Xe GPU)版則面向企業級市場,同時,該版本也能夠支持獨顯;而16核(12核Xe GPU)則面向游戲、高性能輕薄本等市場。

全新的Xe3 GPU是Panther Lake的一大亮點,Panther Lake最多支持12個Xe3核心,最大16MB的L2緩存,最多12個光追單元以及120TOPS的算力。
Xe3相較于Lunar Lake的性能表現提升了50%,相較于Arrow Lake H的每瓦性能高出40%。此前英特爾在Tiger Lake、Meteor Lake等代際產品中,也實現過GPU的性能顯著升級,但像Xe3這樣達到50%的巨幅提升是近年來罕見的。

相較于一般的CPU選型“高U低顯”或“高顯低U”的配置,16核(12核Xe GPU)版本將CPU和GPU的配置拉滿。對此,高嵩表示,16核(12核Xe GPU)是此次的一個亮點,提供了全新的配置選項,在實際核心的配置上,英特爾的策略是希望堅持CPU和GPU雙強并進,已提供卓越的性能體驗,力求達到最佳的平衡表現。
高嵩指出,在當前很多支持AI應用方面,有超過一半的AI負載跑在GPU上,20%左右跑在NPU上,10%跑在CPU上,通過12Xe可以支持更多的內容創作工作,而如果是游戲場景,也有NPU和GPU做支持。
“例如我們跟逗逗、新智慧芯做的游戲助手,是將多的算法放到了NPU上,然后讓GPU接著去跑游戲。盡管異構硬件架構并非英特爾獨有,但目前只有我們通過深度的軟件優化,真正實現了CPU、GPU、NPU的協同增效。”高嵩說。
XPU協同:180TOPS算力應對AI挑戰
Panther Lake集成了全新的NPU5,架構目標是面積效率以及為最新的負載優化。

相較Lunar Lake,Panther Lake的NPU5算力密度提升超過40%,最高50TOPS算力,相較于Arrow Laker-H算力提高3.8倍。在量化方面,Panther Lake實現原生支持FP8,使其對大語言模型的支持更好。值得一提的是,NPU5在面積上實現的顯著縮小,對降低制造成本和集成度具有重要意義。
在AI能力上,Panther Lake平臺總共擁有180TOPS的算力,CPU、NPU、GPU三個AI加速器分別擁有10TOPS、50TOPS、120TOPS,以用于不同的工作負載。
目前,行業對于AI性能的評測集中在模型參數。英特爾中國區技術部總經理高宇指出,Panther Lake能夠支持70B的模型,但30B的MOE的模型,才是既有智能表現又有良好用戶體驗的選擇。而這正是英特爾Panther Lake,包括Arrow Lake所能支持的最佳甜蜜點。在提供了如此大的顯存后,除了能夠運行30B的MOE模型,還能支持非常長的上下文處理。
“在進行AI性能評測時,應該將重點放在這些實際的用戶體驗和創新應用上,而不是僅僅追求能夠運行多大的模型,因為那樣跟實際意義是有一定差距的。”高宇說。
高宇表示,英特爾堅持深耕XPU的路線,強調CPU、GPU、NPU的協同。CPU擅長快速響應,適合處理語音轉文字等應用,GPU因為有足夠的吞吐量和帶寬支持,適合高并發和高帶寬需求的應用,而NPU因為能效比很高,適合追求能效的應用。

在IPU方面,全新的IPU7.5在圖像處理上帶來了顯著升級。新增的Staggered HDR功能,能夠實現硬件加速、雙重曝光、自適應曝光控制、AI光學降噪等創新功能,能夠大幅改進暗光場景下的圖片和視頻質量。
英特爾在AI圖像應用方面一直走在前沿,例如AI局部調色等創新功能,都有著出色成果。之所以非常重視前置攝像頭的能力,在于ISP與AI應用有著密不可分的關系。
“攝像頭作為重要的傳感器,與AI結合之后,能夠極大拓展應用邊界。合作伙伴也提出針對于會議場景的攝像頭智能記錄,甚至捕捉參會人員實時反應的需求。此外,對于習慣用紙筆記錄會議摘要的用戶,一個結合AI技術的高性能攝像頭,能夠將手寫內容轉化為可編輯的電子文檔等。因此,對于IPU的提升將顯著增強包括視頻會議和通話在內的使用體驗,解鎖更多AI應用的可能性。”高嵩說。
而對于提升IPU能力所可能造成的成本挑戰。高宇解釋稱,PC上通常配置的攝像頭像素范圍在500萬到1300萬之間,遠未達到4800萬像素級別,因此攝像頭本身的硬件成本可控。關鍵在于,即使是相同的攝像頭硬件,通過英特爾IPU的驅動和優化,其整體成像效果將遠超采用外掛USB驅動的方案。

在多媒體顯示方面,XeMedia Engine支持廣泛的編解碼,包括最新的AVC、AC1、XAVC-H等,據了解,該項技術的創新主要由中國團隊完成。
連接不妥協:支持Wi-Fi 7(R2)
在連接方面,Panther Lake采用的是業界領先的Wi-Fi 7(R2)。因為Wi-Fi 7標準本身比較靈活,目前很多Wi-Fi 7技術只使用了R1版本中的部分特性,而英特爾在支持Wi-Fi標準時,是按照最嚴格的要求來支持,這也帶來了更快的速度,更高的穩定性和安全性,這一點特別對于企業級用戶而言非常重要。
Panther Lake支持藍牙6,特別是其Auracast功能。Auracast允許用戶的耳機在不干擾他人的情況下,共享同一音頻源,同時,也能夠實現對于低功耗藍牙(LE Audio)的支持,顯著降低設備功耗。
在有線連接方面,Panther Lake配備了三個Thunderbolt端口,Thunderbolt 5需要獨立的芯片,而Thunderbolt 4則已集成到主控中。
毫無疑問,上述在連接方面的更強性能,對于AI PC而言將顯著優化用戶體驗。
領先能效:CPU多線程功耗降低30%
除了領先的性能外,Panther Lake在一系列創新技術的加持下,所表現出的極致能效也令人印象深刻。
LPE核心首次在Meteor Lake中引入,并僅在酷睿Ultra高端型號中率先集成,并在后續的Lunar Lake和Arrow Lake中被使用。
在Panther Lake中,采用了4個LPE核,這可能反映出LPE核心性能上的提升,以及英特爾在管理和調度上的成熟和完善。
比如針對一些負載任務,同早期Arrow Lake和Raptor Lake先從P核開始,再根據負載轉移的調度策略不同,自Meteor Lake和Lunar Lake開始,英特爾轉向LPE核優先。
在Lunar Lake上,任務將優先在LPE核高效執行,如果LPE核能夠處理,任務會迅速完成;如果需要更高性能,系統會智能地拉起四個P核和四個E核協同工作,待任務完成后再返回LPE核,以實現能效最大化。面對更重負載,所有核心將全面啟動,以提供最強性能。
這種情況,在DC(直流供電,即電池供電)模式將非常明顯,在此模式下,系統認為續航優先,會積極地將資源配置為效率區(efficiency zone)模式,并盡可能地將工作負載優先分配給LPE核,以最大限度地延長電池使用時間。
以B站重彈幕視頻播放為例,任務首先在LPE核運行,遇到重負載時P核介入,負載降低后再返回LPE核。另一個案例是Teams應用,這是一個輕負載,在Lunar Lake上,通過Windows WPA工具分析可以看到,負載基本上都在LPE側,P核的線程調度上只有零星部分,大概在幾十或者是幾百微秒。

此外,為了更好地獲得時延、帶寬和能效表現,Panther Lake還采用Memory side cache(內存側緩存)技術(8MB物理緩存),這是能效提升的另一個重要原因。
簡要而言,內存側緩存技術就是把數據緩存放到離處理器更近的地方,減少DRAM擁堵和功耗,使數據被抓取成功的概率更高,傳輸距離更短,縮短延遲提升帶寬。這項技術也是在目前Windows PC領域英特爾的獨家技術。

除了硬件層面外,在軟件方面,Panther Lake采用了進一步優化的硬件線程調度器,其扮演著連接操作系統和硬件之間的橋梁角色,能夠根據實時監控到的指令集,對CPU上的所有線程進行分類,上報給操作系統,結合OS控制區的切換,會將不同工作負載放在不同的核心,在辦公、游戲、加電或者不插電等場景下,對應算法不同。
這和前幾代產品中的調度邏輯有顯著區別,這種優化實際上體現了Intel對軟件硬件一體持續優化的考量,核心目標則是確保更合適的負載能夠被調度到更適合的核心上運行,從而保證最佳的能效和性能。
而在電源管理技術方面,通過在DTT中加入API,Panther Lake允許OEM廠商根據自身的產品定位和用戶需求,靈活地選擇工作負載的調度策略,為OEM提供更大自主權,能夠根據具體場景,決定優先保障能效或追求極致性能,從而打造出更具差異化產品。
得益于內存側緩存、硬件線程調度器、電源管理等技術創新,Panther Lake繼承了Lunar Lake在能效上的優勢,同時,憑借在此基礎上的8個E核的加持,Panther Lake跟Arrow Lake相比不僅能效更高,還實現了性能的顯著提升。
和Lunar Lake相比,Panther Lake CPU在相同功耗下的單線程性能提升超過10%。
和Lunar Lake以及Arrow Lake相比,CPU在相同功耗情況下,多線程能力提升超過50%。
和Arrow Lake相比,CPU在相同多線程性能的同時功耗降低30%。
和Lunar Lake以及Arrow Lake相比,GPU的性能表現提升50%。
同Lunar Lake相比,NPU算力密度提升超過40%,IPU功耗降低1.5W。
同Lunar Lake相比,SoC的能耗提升10%;同Arrow Lake相比,SoC具有40%的能耗降低。
結語
Panther Lake作為英特爾18A工藝的首發產品,是其技術復興與IDM 2.0戰略落地的關鍵載體。依托 Ribbon FET與背部供電技術,以及多項革命性的創新技術,將性能與能效的優化帶到新高度,精準匹配了新時代下AI PC的需求。同時,其架構上的靈活可擴展性的理念,也展現出英特爾更加開放,注重客戶意見和用戶體驗的全新姿態。

Panther Lake驗證了Intel 18A工藝的量產能力,擊碎外界對其技術滯后的質疑,重新定義了AI PC體驗。Panther Lake的量產不僅是英特爾重奪市場優勢的希望,也引領著全球半導體進入 “先進制程+異構協同” 的新紀元。