国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)

半導(dǎo)體行業(yè)觀察
+ 關(guān)注
2022-03-04 11:05
550次閱讀
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
這些數(shù)據(jù)的增長(zhǎng)需要有更大的存儲(chǔ)容量,更高效、高性能的數(shù)據(jù)中心基礎(chǔ)設(shè)施來(lái)存儲(chǔ)和檢索數(shù)據(jù),更快的數(shù)據(jù)移動(dòng)接口,還要能提供更多的計(jì)算資源來(lái)處理數(shù)據(jù)。數(shù)據(jù)增長(zhǎng)也推動(dòng)了數(shù)據(jù)中心運(yùn)營(yíng)商們加大投資,以獲得更高的性能,更強(qiáng)的計(jì)算能力,減少數(shù)據(jù)移動(dòng)(緩存相干接口,計(jì)算存儲(chǔ)),并尋求低功率存儲(chǔ)解決方案,同時(shí)降低碳足跡。

計(jì)算型存儲(chǔ)被提出

數(shù)據(jù)移動(dòng)占數(shù)據(jù)中心能耗的很大一部分,有效的降低數(shù)據(jù)移動(dòng)的數(shù)量可以降低數(shù)據(jù)中心的耗能。舉一個(gè)用數(shù)據(jù)庫(kù)搜索記錄的典型案例:在美國(guó)環(huán)境保護(hù)局(U.S. Environmental Protection Agency)的數(shù)據(jù)庫(kù)中搜索“大氣中二氧化硫含量超過(guò)健康上限75 ppb”的數(shù)據(jù),會(huì)出現(xiàn)數(shù)百萬(wàn)條記錄,但卻僅有不到1/1000是相關(guān)的。傳統(tǒng)方式是將整個(gè)數(shù)據(jù)庫(kù)傳輸?shù)絻?nèi)存中,由主機(jī)CPU處理,大大增加了不必要的數(shù)據(jù)移動(dòng)。如果計(jì)算存儲(chǔ)能夠只向主機(jī)發(fā)送相關(guān)記錄以供進(jìn)一步分析的話,則能大大減少數(shù)據(jù)的移動(dòng)量。
如果能為存儲(chǔ)設(shè)備(計(jì)算存儲(chǔ))增加計(jì)算能力則可以提高性能和降低能耗。具體表現(xiàn)在:一方面可以減少數(shù)據(jù)移動(dòng)和關(guān)聯(lián),比如減少延遲和網(wǎng)絡(luò)帶寬的消耗;另一方面將數(shù)據(jù)保留在驅(qū)動(dòng)器內(nèi),具有更高的安全性;再者其還可以針對(duì)工作負(fù)載優(yōu)化處理。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
新的計(jì)算存儲(chǔ)架構(gòu)在傳統(tǒng)的基礎(chǔ)上,加入存儲(chǔ)計(jì)算處理器(如下圖所示),由存儲(chǔ)處理器執(zhí)行關(guān)鍵操作和數(shù)據(jù)過(guò)濾,只向主機(jī)發(fā)送關(guān)鍵數(shù)據(jù),并且計(jì)算資源根據(jù)CSD的數(shù)量進(jìn)行擴(kuò)展。CSD架構(gòu)的優(yōu)勢(shì)在于存儲(chǔ)端的處理器可以根據(jù)應(yīng)用進(jìn)行優(yōu)化,提供更好的性能同時(shí)減少硬件的花費(fèi)。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)

新思的計(jì)算存儲(chǔ)處理器IP

計(jì)算存儲(chǔ)數(shù)據(jù)流的過(guò)程通常是這樣的:首先主機(jī)發(fā)起高級(jí)命令(例如查找匹配特定鍵的記錄),然后計(jì)算存儲(chǔ)處理器分析命令并發(fā)起讀請(qǐng)求,接下來(lái)計(jì)算存儲(chǔ)處理器需要構(gòu)建傳輸描述符,描述符被分派到適當(dāng)?shù)膄lash通道,從flash返回的讀取數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)路徑并由計(jì)算存儲(chǔ)處理器進(jìn)行分析(進(jìn)程鍵匹配),將匹配記錄發(fā)送到DDR(如果匹配),再將封裝在主機(jī)接口協(xié)議中的DDR和DMA中的記錄數(shù)據(jù)匹配到主機(jī)內(nèi)存中,最后從計(jì)算存儲(chǔ)處理器向主機(jī)發(fā)送成功的完成指示(如果沒(méi)有匹配,則向主機(jī)發(fā)送錯(cuò)誤)。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
但是,存儲(chǔ)內(nèi)計(jì)算還有一些注意事項(xiàng),比如SSD需要額外的處理能力,需要有友善的軟件開(kāi)發(fā)環(huán)境,終端應(yīng)用客戶能夠容易的在平臺(tái)上開(kāi)發(fā)應(yīng)用軟件。為此,新思科技推出了DesignWare ARC處理器IP啟用智能存儲(chǔ)驅(qū)動(dòng)器。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
針對(duì)計(jì)算存儲(chǔ)的應(yīng)用,新思科技推出了ARC HS4x/HS4xD處理器,它是為嵌入式應(yīng)用程序優(yōu)化而提供的超標(biāo)量?jī)?nèi)核。它是一款獨(dú)立的、雙發(fā)行的10級(jí)超標(biāo)量體系結(jié)構(gòu),是一款高性能的嵌入書處理器,RISC提高40%,DSP性能提高2倍,每核高達(dá)5400 DMIPS@ 1.8 GHz。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
HS4xD擴(kuò)展了ARCv2DSP ISA的性能范圍,它擁有超過(guò)100+額外的DSP指令,并兼容流行的ARC EMxD內(nèi)核,可用于額外的基帶、語(yǔ)音/語(yǔ)音、音頻。ARC HS4x/HS4xD處理器具有單核、雙核和四核版本。還有著高效的軟件開(kāi)發(fā),其優(yōu)化的編譯器能最大限度的提高RISC和DSP性能,以及具有優(yōu)化的DSP庫(kù)支持。
除了既有的DSP指令之外,ARC 處理器IP還提供了APEX (ARC Processor Extension)的技術(shù)提供用戶自行添加指令來(lái)加速特定的算法。
一個(gè)案例是使用APEX獲得更好的SSD效率。在這個(gè)案例中,新思的客戶采用了APEX的技術(shù)新增了專用指令進(jìn)行紅黑樹(shù)搜索算法的優(yōu)化紅黑樹(shù)搜索算法是經(jīng)常被使用在FTL (Flash Translation Layer)中的搜索算法,用于在內(nèi)存中對(duì)I/O請(qǐng)求進(jìn)行排序。結(jié)果發(fā)現(xiàn),使用APEX指令能減少3個(gè)關(guān)鍵功能50%循環(huán)計(jì)數(shù),而只增加了5%的核心面積。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
新思科技還推出了ARC HS6x處理器,它是一款基于ARCv3的面向高端嵌入式優(yōu)化的64位ISA。ARCv3 ISA和微架構(gòu)可擴(kuò)展到12核的集群,最多16mb的共享集群緩存,向后兼容32位ARCv2內(nèi)核。最高性能的ARC標(biāo)量處理器可達(dá)6.1 CM/MHz(單核HS6x),其單核性能比HS4x提高20%,在HS4x (x4)上,具有最多3倍的集群性能。其優(yōu)化的開(kāi)發(fā)工具支持簡(jiǎn)化了軟件開(kāi)發(fā),最大化了性能。ARC HS6x可在同一集群內(nèi)動(dòng)態(tài)調(diào)整NVMe-oF和Flash管理軟件所占用的核心數(shù)量,增加軟件運(yùn)行的靈活性。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)
據(jù)了解,新思科技的下一代ARC可擴(kuò)展集群架構(gòu),高度可擴(kuò)展到高達(dá)100gb/s相干,800gb /s非相干帶寬;能最多拓展至12個(gè)ARC核,外加16個(gè)客戶IP和IO設(shè)備接口;所有的核心和集群內(nèi)存都可以在它們自己的時(shí)鐘和電源域中運(yùn)行。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)

AI是未來(lái)存儲(chǔ)解決方案的一部分

人工智能正在迅速發(fā)展,且是一項(xiàng)不可或缺的技術(shù)。為什么人工智能會(huì)出現(xiàn)在存儲(chǔ)領(lǐng)域?因?yàn)槿斯ぶ悄苄枰獢?shù)據(jù),而數(shù)據(jù)就要存放在存儲(chǔ)中。而且邊緣的數(shù)據(jù)正在大幅增長(zhǎng),移動(dòng)數(shù)據(jù)的“代價(jià)昂貴”。其實(shí)大多數(shù)人工智能處理可以在存儲(chǔ)中完成。人工智能可用于離線處理數(shù)據(jù),然后根據(jù)需要將其移動(dòng)到數(shù)據(jù)中心或云。
AI在存儲(chǔ)中的應(yīng)用有很多,如預(yù)測(cè)熱點(diǎn)和冷數(shù)據(jù)、根據(jù)需要的訪問(wèn)確定數(shù)據(jù)存儲(chǔ)位置、數(shù)據(jù)生命周期管理、從存儲(chǔ)的數(shù)據(jù)中發(fā)現(xiàn)洞察力、創(chuàng)建元數(shù)據(jù)(關(guān)于數(shù)據(jù)的數(shù)據(jù))、進(jìn)行對(duì)象檢測(cè)和分類、存儲(chǔ)分層(平衡速度,存儲(chǔ)成本)、提升SSD性能和QoS、延長(zhǎng)SSD壽命/提高可靠性、低寫放大因子(WAF)、數(shù)據(jù)聚類、flash糾正錯(cuò)誤、故障預(yù)測(cè)。
具有可編程神經(jīng)網(wǎng)絡(luò)加速器的人工智能處理器經(jīng)常使用在計(jì)算存儲(chǔ)處理架構(gòu)中實(shí)現(xiàn),下圖是新思科技的ARC EV 處理器,擁有向量DSP以及神經(jīng)網(wǎng)絡(luò)加速器的異質(zhì)架構(gòu),非常適合用在人工智能存儲(chǔ)的應(yīng)用中。
利用應(yīng)用處理器IP構(gòu)建人工智能計(jì)算型存儲(chǔ)系統(tǒng)

總結(jié)

傳統(tǒng)的數(shù)據(jù)從驅(qū)動(dòng)器移動(dòng)到計(jì)算,需要跨接口和協(xié)議移動(dòng),消耗大量時(shí)間和增加延遲,而且移動(dòng)數(shù)據(jù)要消耗能量,數(shù)據(jù)復(fù)制多次,具有較低的安全。在這樣的情況下,存儲(chǔ)內(nèi)計(jì)算被提出。存儲(chǔ)內(nèi)計(jì)算能將計(jì)算在存儲(chǔ)裝置中完成,最大限度地減少數(shù)據(jù)移動(dòng),減少延遲,最大限度地減少能量的消耗。數(shù)據(jù)將保留在驅(qū)動(dòng)器中,本地?cái)?shù)據(jù)具有更高的安全性。可以針對(duì)工作負(fù)載優(yōu)化處理。人工智能(NN架構(gòu))也將逐漸成為未來(lái)存儲(chǔ)解決方案的一部分。

*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

 

本文來(lái)自微信公眾號(hào) “半導(dǎo)體行業(yè)觀察”(ID:icbank),作者:杜芹,36氪經(jīng)授權(quán)發(fā)布。

0
消息通知
咨詢?nèi)腭v
商務(wù)合作