未來異型自動插件機技術趨勢發(fā)展分析

    作者:wenwen 發(fā)布時間:2018-12-14 點擊數:

            目前主流異型自動插件機AI芯片的核心主要是利用MAC(MultiplierandAccumulation,乘加計算)加速陣列來實現對CNN(卷積神經網絡)中最主要的卷積運算的加速。這一代AI芯片主要有如下3個方面的問題。

            (1)異型自動插件機深度學習計算所需數據量巨大,造成內存帶寬成為整個系統(tǒng)的瓶頸,即所謂“memorywall”問題。

            (2)與第一個問題相關,內存大量訪問和MAC陣列的大量運算,造成AI芯片整體功耗的增加。

            (3)異型自動插件機深度學習對算力要求很高,要提升算力,最好的方法是做硬件加速,但是同時深度學習算法的發(fā)展也是日新月異,新的算法可能在已經固化的硬件加速器上無法得到很好的支持,即性能和靈活度之間的平衡問題。

            因此,可以預見異型自動插件機下一代AI芯片將有如下的五個發(fā)展趨勢。

            (1)更高效的大卷積解構/復用

            在標準SIMD的基礎上,CNN由于其特殊的復用機制,可以進一步減少總線上的數據通信。而復用這一概念,在超大型神經網絡中就顯得格外重要。異型自動插件機如何合理地分解、映射這些超大卷積到有效的硬件上成為了一個值得研究的方向,

            (2)更低的Inference計算/存儲位寬

            AI芯片最大的演進方向之一可能就是神經網絡參數/計算位寬的迅速減少——從32位浮點到16位浮點/定點、8位定點,甚至是4位定點。在理論計算領域,2位甚至1位參數位寬,都已經逐漸進入實踐領域。

            (3)更多樣的存儲器定制設計

            當計算部件不再成為神經網絡加速器的設計瓶頸時,如何減少存儲器的訪問延時將會成為下一個研究方向。通常,異型自動插件機離計算越近的存儲器速度越快,每字節(jié)的成本也越高,同時容量也越受限,因此新型的存儲結構也將應運而生。

            (4)更稀疏的大規(guī)模向量實現

            神經網絡雖然大,但是,實際上有很多以零為輸入的情況,此時稀疏計算可以高效的減少無用能效。來自哈佛大學的團隊就該問題提出了優(yōu)化的五級流水線結,在最后一級輸出了觸發(fā)信號。在Activation層后對下一次計算的必要性進行預先判斷,如果發(fā)現這是一個稀疏節(jié)點,則觸發(fā)SKIP信號,避免乘法運算的功耗,以達到減少無用功耗的目的。

            (5)計算和存儲一體化

            異型自動插件機計算和存儲一體化(process-in-memory)技術,其要點是通過使用新型非易失性存儲(如ReRAM)器件,在存儲陣列里面加上神經網絡計算功能,從而省去數據搬移操作,即實現了計算存儲一體化的神經網絡處理,在功耗性能方面可以獲得顯著提升。

            以上就是小編關于未來異型自動插件機技術趨勢發(fā)展分析的介紹,希望對大家有用哦!

    責編:文文
    加入收藏
    主站蜘蛛池模板: 久久久久久久久久久免费精品| 久久国产精品偷99| 国产精品玖玖美女张开腿让男人桶爽免费看 | 日本加勒比久久精品| 69国产成人综合久久精品| 色哟哟国产精品免费观看| 2022国产精品最新在线| 久久精品欧美日韩精品| 国模精品一区二区三区| 99re这里只有精品6| 亚洲精品国产自在久久| 国产高清在线精品一区二区三区| 久久99精品久久久久子伦| 欧美日韩精品久久久久| 成人精品一区二区久久久| 99在线精品视频| 人人妻人人澡人人爽欧美精品| 久久久久这里只有精品| 99久久人人爽亚洲精品美女| 99久久这里只有精品| 人妻少妇偷人精品无码| 在线精品亚洲一区二区| 完整观看高清秒播国内外精品资源 | 国产在线精品一区二区不卡麻豆| 九九在线精品视频专区| 国产精品一区二区久久不卡 | 亚洲一区二区精品视频| 国产精品无码素人福利| 国产麻豆一精品一AV一免费| 亚洲精品亚洲人成人网| 四虎影视永久在线精品免费| 久久精品国产99久久久香蕉| 国产精品玖玖美女张开腿让男人桶爽免费看 | 国产2021精品视频免费播放| 奇米影视7777久久精品| 中文国产成人精品久久不卡| 亚洲国产成人精品无码久久久久久综合 | HEYZO无码综合国产精品227| 久久久久久国产精品免费无码| 亚洲一区爱区精品无码| 亚洲国产成人a精品不卡在线|