Deep Vision 是一家致力于為邊緣計算解決方案打造人工智能推理芯片、成立至今已有六年的初創(chuàng )企業(yè)。今日,該公司宣布推出了全新的 ARA-1 處理器,有望在低延遲、高效能、以及計算性能之間找到合適的平衡。Deep Vision 表示,該芯片可在相機傳感器、到成熟的邊緣計算服務(wù)器等領(lǐng)域發(fā)揮重要的作用。
得益于在實(shí)時(shí)視頻分析方面的實(shí)力,該芯片主要面向智能零售領(lǐng)域的解決方案,比如無(wú)人收銀的商店、智能城市、工業(yè) 4.0 / 機器人等領(lǐng)域。此外該公司海域汽車(chē)行業(yè)的供應商合作,主要圍繞自動(dòng)駕駛之外的車(chē)內監測,以避免駕駛員分心或疲勞駕駛。
在斯坦福大學(xué)的博士學(xué)位論文中,Hameed 和 Qadeer 介紹了他們開(kāi)發(fā)的 Deep Vision 體系架構。
該架構致力于最大程度地減少芯片內的數據移動(dòng),因而在 AI 工作負載上具有出色的每瓦特、每美元的性能和效率表現。不過(guò)在推出可用硬件之前,Deep Vision 很早就將精力集中到了構建自家的編譯器上,以確保該公司的解決方案可真正滿(mǎn)足客戶(hù)需求,然后才完成最終的芯片設計。
Rehan Hameed 表示,Deep Vision 特別強調減少 AI 計算的延遲,而市面上許多解決方案更樂(lè )于宣傳有多高的數據吞吐量。但是該團隊認為,在邊緣解決方案中,低延遲是一項更重要的性能指標。相比之下,吞吐量只有在數據中心等領(lǐng)域才顯得有意義。
Deep Vision 首席技術(shù)官 Rehan Hameed 解釋稱(chēng),那些追求數據吞吐量的架構,要求加速器同時(shí)來(lái)處理大量的數據流(無(wú)論是通過(guò)批處理、還是管道執行),以充分發(fā)揮硬件的性能。然而這也是競爭方案獲得高吞吐量的唯一途徑,且這么做會(huì )導致單個(gè)任務(wù)的延遲相當高,使之難以在更側重于實(shí)時(shí)性能的邊緣用例中發(fā)揮作用。
值得一提的是,Deep Vision 宣稱(chēng)其 AI 處理器的延遲要遠低于谷歌 Edge TPU 和 Movidius 的 MyriadX 方案。除了通過(guò)硬件架構優(yōu)化來(lái)將芯片上的數據移動(dòng)降至最低,還利用軟件層面的工作負載優(yōu)化,來(lái)改善架構內的整體數據流動(dòng)。