來(lái)源:E企研究院

大語(yǔ)言模型帶來(lái)的智能涌現,讓人們意識到:強人工智能的時(shí)代真正來(lái)臨。大語(yǔ)言模型與強化學(xué)習的結合讓機器與人類(lèi)的行為實(shí)現對齊,甚至體現了更高水平的洞察力。第四次工業(yè)革命的技術(shù)底座由5G、物聯(lián)網(wǎng)、機器學(xué)習構成,而人工智能將這些拼圖融合在一起。

多模態(tài)的信息輸入、預處理、學(xué)習、推理……這些關(guān)鍵性流程的應用門(mén)檻迅速降低,推動(dòng)企業(yè)數字化轉型進(jìn)入新的階段。許多領(lǐng)域正在積極引入機器學(xué)習的成果,市場(chǎng)處于快速變化的狀態(tài)。數據中心的性能需求旺盛,機器學(xué)習等訓練任務(wù)促進(jìn)了云上性能的發(fā)展,不論是算力,還是網(wǎng)絡(luò )帶寬。來(lái)自邊緣側的需求也在提升——數據的本地化需要,或者嚴格的實(shí)時(shí)性要求等。FPGA是提升新型工作負載效能的理想選擇之一,其具有硬件級的性能,又擁有適應多樣任務(wù)需求的靈活性,且可以非??焖俚剡M(jìn)入市場(chǎng)。

11月14日,英特爾在北京舉辦了以“創(chuàng )新加速,塑造FPGA芯未來(lái)”為主題的2023年英特爾FPGA技術(shù)日,展示了FPGA的新品及全矩陣應用,以及行業(yè)伙伴在數據中心、AI、網(wǎng)絡(luò )、嵌入式等關(guān)鍵領(lǐng)域的諸多應用。

Mike Fitton博士 英特爾可編程方案事業(yè)部副總裁兼網(wǎng)絡(luò )業(yè)務(wù)部總經(jīng)理

全面的產(chǎn)品組合

在技術(shù)日中,英特爾推出了六款FPGA新產(chǎn)品和平臺,其中包括:Agilex 3、Agilex 5、Agilex 7、Nios V軟核處理器、開(kāi)放式FPGA堆棧(OFS)、F2000 IPU平臺。在2023年底,還會(huì )有約10款新產(chǎn)品進(jìn)入市場(chǎng)。覆蓋高、中、低端市場(chǎng)的產(chǎn)品組合,靈活、定制化的平臺功能和強大的可擴展性,輔以高效率的軟件棧,以及極具韌性的供應鏈,英特爾FPGA產(chǎn)品可以幫助開(kāi)發(fā)人員在復雜的環(huán)境中快速構建從云到邊緣的解決方案,滿(mǎn)足各層級的需求。

Agilex 7系列:采用英特爾10制程工藝,支持CXL提高帶寬和連接性能,并借助HBM加快內存訪(fǎng)問(wèn)速度,該具有性能功耗比優(yōu)勢的Agilex 7 M、F和I系列FPGA現已上市。其中,Agilex 7 FPGA R-Tile相較于其他同類(lèi)FPGA產(chǎn)品,其每個(gè)端口的PCIe5.0帶寬速度提高了2倍,CXL帶寬提高了4倍。

Agilex 7開(kāi)發(fā)板

Agilex 5系列:采用第二代英特爾Hyperflex FPGA架構和英特爾7制程工藝,對晶體管的每瓦性能進(jìn)行了優(yōu)化,從而實(shí)現出色的能耗。同時(shí)采用英特爾上一代高端產(chǎn)品中嵌入的業(yè)界首個(gè)針對AI優(yōu)化的模塊,并將其擴展至Agilex 5 FPGA的中端產(chǎn)品中,為邊緣AI應用提供了理想選擇。其中,Agilex 5 E系列FPGA在功耗和尺寸上進(jìn)行了優(yōu)化。

Agilex 3系列:外形小巧,在功耗和成本上進(jìn)行了大幅優(yōu)化,且擁有廣泛的IO支持。其中,即將推出的Agilex 3 B系列FPGA面向電路板和系統管理,包括服務(wù)器平臺管理(PFM)應用;C系列FPGA則針對一系列復雜可編程邏輯設備(CPLD)和FPGA應用提供更多功能以用于垂直市場(chǎng)領(lǐng)域。

值得一提的是,英特爾的定制邏輯芯片不止于FPGA,也包括eASIC和ASIC。三管齊下的組合提供了極高的靈活度,以支持市場(chǎng)對于不同功耗、成本和上市時(shí)間的多樣化需求。與FPGA相比,eASIC(結構化ASIC)的開(kāi)發(fā)時(shí)間較長(cháng),可滿(mǎn)足更低的功耗和單位成本需求,適合以十萬(wàn)計的產(chǎn)品數量。ASIC(標準單元ASIC)在功耗、成本、性能方面更有優(yōu)勢,但開(kāi)發(fā)時(shí)間是eASIC的兩倍,適合百萬(wàn)級以上的產(chǎn)品數量。

智能、互聯(lián)對FPGA的挑戰

當AI進(jìn)入大模型時(shí)代,算力和互聯(lián)帶寬需求激增,甚至遠遠超過(guò)了CPU性能的增長(cháng)速度,系統對各種加速器的需求極其旺盛。對于高性能加速器(含FPGA),面臨三大挑戰,也是發(fā)展趨勢。

芯片創(chuàng )新步伐:不斷變化的標準、層出不窮的工作負載、對更高性能和更高功效的旺盛需求,人們迫不及待的需要用硅來(lái)解決各種難題,傳統的半導體設計方法已經(jīng)很難適應快速迭代的需要。新的芯片需要加快創(chuàng )新步伐、快速集成新功能,選擇適宜的制造工藝、IP、代工服務(wù)?;贑hiplet的異構集成已經(jīng)被證明是后摩爾時(shí)代的理想解決方案。Agilex 7便是典型的Chiplet設計,由Core Fabric芯粒和R-Tile、F-Tile芯粒構成。其中Core Fabric負責提供運算等核心功能,F-Tile負責提供主流的PCIe 4.0收發(fā)器, R-Tile負責支持前衛的PCIe 5.0、CXL2.0等特性的收發(fā)器。

數據激增:海量的數據需要更大的存儲容量和帶寬,內存墻正日益成為設計的瓶頸——再強大的加速器都需要充足的數據來(lái)喂飽。AI應用是典型的受限于內存的場(chǎng)景。Agilex也積極支持最新的內存接口標準,包括DDR5、LPDDR5和HBM2e。

設計復雜性:加速器的工作負載變得日益復雜,更高的性能、更多的控制平面,同一芯片可能需要支持不同的指令集,這些都導致設計復雜性增加。AI負載的需求進(jìn)一步加劇了這個(gè)問(wèn)題,譬如不同的數據精度、跨平臺的協(xié)同等。開(kāi)發(fā)人員需要簡(jiǎn)便的 FPGA 開(kāi)發(fā)、AI 和工作負載加速工作流,開(kāi)放式的加速生態(tài)系統。英特爾OFS、OpenVINO、Quartus等軟件棧資源有助于縮短開(kāi)發(fā)時(shí)間,簡(jiǎn)化跨平臺部署的難度。

快速滿(mǎn)足邊到云的AI擴展需求

AI應用場(chǎng)景日趨多元化,需要復雜多樣的產(chǎn)品才能滿(mǎn)足需求。我們可以將場(chǎng)景分成三類(lèi):云端、網(wǎng)絡(luò )、邊緣。

云端的AI需求主要就是大批量的處理,包括深度學(xué)習、機器學(xué)習等。其特點(diǎn)是數據量龐大、運算負荷大,帶寬要求高,但實(shí)時(shí)性通常不高,甚至允許錯誤回滾。網(wǎng)絡(luò )的AI需求包括數據包檢測、擁塞控制等,對于無(wú)線(xiàn)網(wǎng)絡(luò ),AI還會(huì )用于波束成形等。邊緣側的應用,通常需要較高的實(shí)時(shí)性,譬如工業(yè)、醫療、交通中的識別與控制,以及金融分析等應用,有嚴格的時(shí)延要求。多樣化的應用場(chǎng)景需要不同類(lèi)型的AI算力支撐,數字底座由多層次的、不同指令集的異構算力構成。

邊緣側

對于邊緣側應用,尤其是嵌入式設備,AI是創(chuàng )新的爆發(fā)點(diǎn)。將AI稱(chēng)為嵌入式世界轉型的中心舞臺毫不為過(guò),利用AI可以提高生產(chǎn)力、效率、質(zhì)量、體驗……譬如,在技術(shù)日的現場(chǎng)展示就包括通過(guò)機器學(xué)習增強計算視覺(jué),快速地在生產(chǎn)線(xiàn)中構建缺陷檢測系統。再譬如通過(guò)傳感器跟蹤豐富的、超越人類(lèi)經(jīng)驗感知的設備信息并加以學(xué)習和推理,可以為預防性維護提供參考。物聯(lián)網(wǎng)從數字化到智能化,會(huì )產(chǎn)生巨大的市場(chǎng)需求。5G的普及、AI實(shí)施門(mén)檻降低,使得各種規模、數字化水平的工廠(chǎng)都有機會(huì )進(jìn)入工業(yè) 4.0時(shí)代。

工業(yè)缺陷檢測實(shí)時(shí)平臺演示

邊緣側的應用存在于大量的細分領(lǐng)域,通常是個(gè)性化的,具有小批量的特點(diǎn),適合FPGA進(jìn)行滿(mǎn)足。邊緣側還可能需要多功能疊加,同時(shí)處理多個(gè)卷積神經(jīng)網(wǎng)絡(luò )。需要靈活性,譬如I/O接口類(lèi)型、可定制的數值精度等。這些特點(diǎn)對開(kāi)發(fā)工具也提出了更高的要求。通過(guò)英特爾OpenVINO和FPGA AI Suite開(kāi)發(fā)套件,可以快速生成IP和進(jìn)行RTL硬編碼,快速開(kāi)發(fā)和迭代FPGA,驗證和部署更優(yōu)的深度學(xué)習推理模型。

對于邊緣側,尤其是工業(yè)界的應用,AI應用的鏈條很長(cháng),場(chǎng)景多樣。從數據采集開(kāi)始,需要涉及多種模式的傳感器及數據,部分數據還涉及傳感器融合。眾多的數據經(jīng)過(guò)預處理匯入數據湖,進(jìn)行進(jìn)一步的處理。其中的一些事件作為推理(預測或異常檢測)的輸入,實(shí)時(shí)處理并控制相應的執行器。一部分事件和整個(gè)數據湖積累的數據,可以通過(guò)機器學(xué)習、生成式AI助力,幫助流程、產(chǎn)品、設備的重新設計。在整個(gè)流程當中,會(huì )涉及到包括FPGA、ASIC、CPU、GPU等硬件能力,以及Quartus、OpenVINO等軟件棧。

傳感器融合演示

數據中心

FPGA在數據中心的應用非常廣泛,其中,數據中心的加速功能主要包括兩個(gè)方面:架構加速和應用加速。

一方面是對數據中心基礎設施的加速,也就是架構上的加速。數據中心的資源包括計算、存儲、網(wǎng)絡(luò ),通過(guò)重構,可以降低成本、提升效率,提升整個(gè)數據中心的TCO。

對于計算優(yōu)化型實(shí)例,CPU只是單純的使用計算的功能,對于用戶(hù)而言,虛擬的存儲資源都在IPU下面。相應的,是存儲型的節點(diǎn),有的存儲服務(wù)器會(huì )把盤(pán)直接掛在 CPU 上,但會(huì )受到PCIe通道數量的限制,也有的存儲服務(wù)器把盤(pán)掛在FPGA下。在數據傳輸的過(guò)程中,可以有很多的事情交給FPGA來(lái)做,譬如壓縮解壓、加密解密,或者一些數據的預處理,效率會(huì )比通過(guò)CPU進(jìn)行處理要高的多。

傳統服務(wù)器的內存是安裝在服務(wù)器內,容量是固定的,不能隨意增減。隨著(zhù)CXL協(xié)議的成熟,用戶(hù)可以用FPGA來(lái)做內存的管理。首先是做內存容量的擴展,第二個(gè)階段是內存的池化,將內存動(dòng)態(tài)的分配給需要的計算節點(diǎn)。在內存盒子中,還可以讓NVMe SSD充當內存(如內存語(yǔ)義SSD),或者讓內存充當SSD緩存,可以降低成本或者提升性能,這些對于主機可以是透明的。除了內存、存儲節點(diǎn),數據中心還可以把GPU或者加速節點(diǎn)解耦出來(lái)。

另一方面是應用的加速,包括AI的加速、數據處理的加速,典型如DPU、智能網(wǎng)卡,可以卸載一些原本CPU的處理工作,或者做一些特定的數據處理。加速卡具體承擔哪些方面的處理,是根據對應用、協(xié)議的理解進(jìn)行的,FPGA的可編程性就很適合這種場(chǎng)景。

FPGA還有一個(gè)特點(diǎn)是低時(shí)延,它的數據處理通過(guò)特定的每一個(gè)門(mén),工作流的時(shí)延是可預測的。這種超低時(shí)延的特點(diǎn)對于金融分析、處理非常有價(jià)值,如高頻交易等。LMS和BittWare基于A(yíng)gilex7 FPGA開(kāi)發(fā)的專(zhuān)為金融服務(wù)業(yè)設計網(wǎng)卡,時(shí)延降低了61%,吞吐量提高200%,性能一致性提升超千倍。

專(zhuān)為金融服務(wù)業(yè)而設計的基于英特爾Agilex7 FPGA的網(wǎng)卡

構建可信任、有韌性的供應鏈

供應鏈是技術(shù)日中多次被提及的重點(diǎn)話(huà)題。半導體芯片的需求持續高速增長(cháng),芯片出貨量在2021年已達到1.15萬(wàn)億個(gè),且預計到2030年的平均增長(cháng)率可以達到8%。但是,眾所周知,在過(guò)去幾年中,全球供應鏈面臨著(zhù)非常復雜、廣泛的危機。英特爾的FPGA產(chǎn)品線(xiàn)針對供應鏈難題提出了韌性供應 (Supply Resilience) 計劃,將投資重點(diǎn)放在加強端到端供應鏈、提高產(chǎn)能、增加冗余和增加緩沖庫存,以提升供應鏈的彈性和控制力,不但要滿(mǎn)足客戶(hù)需求,還要降低未來(lái)再次遭遇供應鏈中斷的風(fēng)險。相關(guān)的舉措包括優(yōu)化產(chǎn)品組合,增加采購來(lái)源,如對更多基板供應商進(jìn)行認證、擴大測試和組裝能力,與包括臺積電、三星、格芯在內的晶圓代工廠(chǎng)合作擴大晶圓產(chǎn)能等。PSG 全球銷(xiāo)售總經(jīng)理 Sean Dougherty表示,目前PSG已經(jīng)完全擺脫供應困局,所有產(chǎn)品的交付周期也已恢復到正常水平。

預計到2023年第四季度,英特爾主要FPGA產(chǎn)品的交貨時(shí)間將達到16周或更短時(shí)間。產(chǎn)品供應周期將長(cháng)達15年或更長(cháng)時(shí)間??深A測的交付和長(cháng)生命周期,加上敏捷的原型設計,將極大提升FPGA客戶(hù)的信心。

免責聲明:市場(chǎng)有風(fēng)險,選擇需謹慎!此文僅供參考,不作買(mǎi)賣(mài)依據。

標簽: