• <dl id="n7sq3"></dl>

        1. 资讯中心

          百度熊掌号

          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理

          2018-12-08 10:36:49来源:镁客网 阅读量:23510

          导读:BM1682与BM1680使用了相同的深度学习算法的硬件加速模块,但相比BM1680而言,BM1682具有更强大的深度学习算法执行能力。
            【中国智能制造网 产品评测】BM1682与BM1680使用了相同的深度学习算法的硬件加速模块,但相比BM1680而言,BM1682具有更强大的深度学习算法执行能力,此外BM1682还增加了视频处理子模块,以及适用于具体应用场景的诸多功能模块。
           
            根据比特大陆?#36824;?#31070;秘务实的风格,相信基于BM1682的板卡、服务器也已经备好了。笔者在芯片行业浸淫十多年,尝试根据比特大陆公布的产品白皮书,来分析一下这两代人工智能芯片之间的异同,尝试谈一谈比特大陆在人工智能领域的意图和野心。
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
            2017年第4季度,比特大陆正式推出了其人工智能品牌算丰(SOPHON),发布了全球首款公开发售的TPU(Tensor Processing Unit张量计算单元)芯片BM1680,专门用于人工智能中的深度学习加速。?#22791;?#19981;足一年,2018年3月,比特大陆又推出其第二款TPU芯片BM1682,根据初步披露的资料显示,BM1682是一块专门用于图像/视频处理方向的人工智能芯片。
           
            BM1682与BM1680使用了相同的深度学习算法的硬件加速模块,但相比BM1680而言,BM1682具有更强大的深度学习算法执行能力,此外BM1682还增加了视频处理子模块,以及适用于具体应用场景的诸多功能模块。
           
            下面我们?#20113;?#20004;者进行一个具体的对比评测:
           
            顶层架构——BM1682定位更细分
           
            从顶层架构可以看出,BM1680和BM1682均集成了深度学习算法所用到的核心模块NPUs。NPU是比特大陆自行研发的深度学习算法硬件加速器,用于加速深度学习算法的执行速度。
           
            从顶层架构图上可以看到,BM1680比BM1682额外集成了高度定?#39057;腂MDNN Chip Link Subsystem。该子模块可以在高速SerDes上提供稳定、灵活、?#33073;?#36831;的链路。用户可以通过该链?#26041;?#22810;个BM1680芯片连接成一个统一的整体,使其协同工作,大大提高?#20302;?#30340;运算能力。BM1682并没有集成此模块,这大概是基于BM1682专?#25442;?#30340;市场应用定位,以及处理速度足够满足用户对图像/视频处理需求而考虑的。
           
            从顶层架构图上可以看到与BM1680相比,BM1682芯片的整体架构发生了不小的变化,其定位则更加细分明确。从右上角增加的Video Subsystem模块可以明确看出,该款芯片定位于图像/视频处理方向。
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
          (数据来自比特大陆)
           
            模块细节——BM1682设计更丰富
           
            BM1682的深度学习加速的核心功能模块与BM1680是相同的。两款芯片均包含了深度学习的核心单元—硬件加速器NPU Subsystem。两者的NPU Subsystem均各自集成了64个NPU单元,统一由NPU Schedule Engine进行调度(BM1682架构图中未体现),大化的提高了NPUs的效率,加快了深度学习算法inference (推演)与training (训练)的速度。根据初步资料显示,两者在MCU的配置上是?#34892;?#35768;差异的,但由于资料不全面,故无法评断出两者的MCU处理能力的差别。
           
            除了深度学习算法硬件加速模块(NPUs)、用于高速连接其余BM1680的Chip Link模块之外,BM1680?#22266;?#20379;了4个独立的DDR4通道,高支持16GB的DDR3 或 DDR4 DRAM拓展,用于高速数据缓存读取,以提高?#20302;?#30340;执行速度。BM1680还加入了Global DMA模块。DMA用于提供数据搬移功能,这可以在大块数据进行读写搬移时不占用MCU的资源,如在DDR4 的RAM中搬移数据时。对于大数据量的深度学习?#20302;常珼MA可以极大的提率。BM1680的Peripheral Subsystem 提供了UART、SPI、IIC与GPIO等接口,用于外接传感器,或与外界进行通讯、记录、控?#39057;?#25805;作。这些接口都属于通用接口,可见BM1680的定位就是通用深度学习芯片,在外设上没有给与太多支持。
           
            从架构图看,BM1682明显复杂了很多。其额外增加了AP (Application Processor) Subsystem和Video Subsystem(视频处理?#20302;?。Video Subsystem(视频子?#20302;?则主要专注于视频预处理的相关任务。
           
            BM1682的Video Subsystem提供了2个H.264视频解码器,1个H.265解码器。H.264 /H.265均为视频编码方式,也是比较流行的视频编码的两种方式。相对而言,H.265视频编码比H.264具有更高的压缩比、更强的网络?#26469;硎视?#33021;力,但考虑到现阶段在安防、智能家居和互联网视频领域中仍?#25442;?#26159;以H.264编码的视频和视频设备为主,两者2:1的译码器数量在视频支持类型和解码带宽做了一个合适的权衡。比较贴心的是,BM1682提供了Video Post-Processing功能,该子模块用于对采用H.264或H.265编码的视频进行渲染处理,这些渲染处理主要包括颜色空间转换、视频剪裁、缩放操作、仿射变换、多帧拼接等常规操作。经过Video Post-Processing对外界进入的视频数据进行硬件加速预处理后,Video Subsystem会将处理后数据通过总线传输给NPUs、DRAM、AP System或外接存储设备,?#32531;?#36827;行后续的深度学习处理等操作。
           
            BM1682提供了丰富的外界?#25442;?#25509;口,如高速接口PCIE、以太网、SDIO3.0、WIFI?#21462;M1682将数据处理完毕后可以很方便的通过PCIE接口、以太网接口、或者WIFI接口将数据传输到总服务器。若是条件限制没有网络接入点,用户可以选择通过接入SDIO3.0的eMMC存储器或是PCIE式存储器将数据存储到本地存储装置。可见,BM1682?#20113;?#21487;能的应用场景做了充分的考虑并给予了硬件支持,用户可以根据需求,灵活方便的进行配置。
           
            Peripheral Subsystem方面,BM1682比BM1680要丰富的多,这大大方便了用户进行?#20302;?#25299;展,如添加额外传感器?#21462;M1682的外设包括2个SPI接口、4个UART接口、4个IIC、4路PWM生成器、一块内嵌式SPI Flash、WDG、Timer、GPIO、PVT Sensor、Top Reg、Efuse、ROM。由给出的外设可以看到,BM1682的设计考虑了配置、存储、对外界?#20302;?#23454;时控制、以及?#29992;?#20445;护等功能,极大提高了?#20302;?#30340;灵活性、安全性,省却了用户额外添加相关功能的开发成本。
           
            性能分析——BM1682极大提升
           
            NPU深度学习硬件加速器是人工智能的核心。两者NPUs模块集成了64个NPUs单元,通过NPU Schedule Engine进行调度。BM1682中每个NPU含有32个EUs,BM1680未知。根据BM1680、BM1682数据手册显示,单片BM1680单精度运算速度为2TFLops;单片BM1682单精度运算速度为3TFLops。BM1682的单片运算速度高出BM1680 50%。
           
            BM1680单片的运行速度低于BM1682,但BM1680支持级联工作模式,数个BM1680可以通过高速的Chip Link Subsystem组成一个集群式的?#20302;常?#36827;行更高处理量的运算处理任务。BM1682不具备级联功能。下图为BM1680芯片的级联连接示意图。
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
          图|级联方式?#22909;?#20010;Node代表一个BM1680
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
            电学方面,根据两者的数据手册显示:满载工作时BM1680的TPD(Thermal Design Power热设计功耗)为41W;:满载工作时BM1682的TPD小于50W。从功耗角度分析,BM1680的2TFlops的NPUs速度应该是有所保留的。
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
          (数据来自比特大陆)
           
            开发生态——两代芯片都很到位
           
            BM1680、BM1682均支持的主流的CNN/RNN/DNN深度学习架构,通过这两款TPU芯片进行硬件加速,可以极大的提高深度学习算法的执行速度。?#27604;唬珺M1680和BM1682?#37096;?#20197;通过基础的矩阵运算进行深度学习的模型、架构的搭建。
          比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理
            在开发生态方面,两款芯片的支持也是很到位的。BM1680、BM1682均对后端用户提供SDK;如果用户需要进行深度优化以获取算法优性能,可以联系厂家获得相关教学支持。
           
            应用领域——BM1682更专注图像、视频处理
           
            由前述分析可知,BM1680为通用性人工智能芯片,其应用方向没有偏向性,芯片内部主要集成了深度学习算法所需要的基本模块,应用各种人工智能的深度学习算法,通过添加相应的外围电路模块,BM1680可?#28304;?#24314;成适用于任一个领域的深度学习?#20302;?mdash;—像图片识别、自然语言处理、文本处理、金融、医学等等大小领域均可选择该芯片实现。BM1680更加具有灵活性。而且,BM1680可以进行级联,所以对于需要处理巨大数据量的人工智能深度学习?#20302;常珺M1680?#20219;?#21512;适。像企业级应用、海量数据处理等方面,通过简单的级联BM1680就可以获取相匹配的计算能力,灵活而强大。
           
            而BM1682则是一个升级版的BM1680并配备了专门用于视频处理的集?#19978;低常?#25972;个BM1682芯片搭载了视频处理所需要的全部核心模块,以及?#20113;?#20855;体应用场景?#35270;?#24615;的辅助模块。BM1682对于需要进行图像/视频处理的市场应用可谓是十分便捷了。BM1682的辅助功能配置模块?#28304;?#26377;线与无线网络功能,对于视频监控方向的市场应用十分方便,无线功能更是省略了网线布线的繁琐施工,并且可用于实现远程监控。对于一些没有网络的场合,如科研领域的野外视频收集处理、闭路视频监控等,BM1682可以轻松的添加外置存储装置进行数据备份收集。BM1682作为图像/视频方向深度学习的SoC片上?#20302;常?#24066;场前景很是广阔,这款新品还是很值得期待的。
           
            (原标题:比特大陆第二代人工智能芯片BM1682测评:专门用于图像、视频处理)

          我要评论

          所有评论仅代表网友意见,与本站立场无关。

          相关新闻

          人工智能这一盘棋 中、美、欧如何博?#27169;?/a> 2019-03-08 14:33:36
          世界各主要经济体纷纷将人工智能上升为国家战略,陆续出台了一系列政策措施,并加大资金?#24230;耄?#25193;大对国内人工智能产业落地的支持。
          新AI领军者崛起 以色列将成第三大AI超级体? 2018-11-26 09:06:06
          中国正在人工智能领域追赶美国,?#20998;?#30340;人工智能专家也在挑战美国和中国,但一个新的人工智能领军者正在迅速崛起。
          深度学习巨头本吉奥:“人工智能”正在被滥用 2018-10-22 08:38:29
          人工智能一词正在被滥用,?#34892;?#20844;司拟人化了AI?#20302;常路餉I?#20302;?#26159;与人类相当的智慧实体,但其?#30340;?#21069;还没有出现与人类智慧相当的实体。

          版权与免责声明:凡本网注明“来源:中国智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-中国智能制造网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权?#27573;?#20869;使用,并注明“来源:中国智能制造网”。违反上述声明者,本网将追究其相关法律责任。

          本网转载并注明?#20113;?#23427;来源(非中国智能制造网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和?#20113;?#30495;实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载?#20445;?#24517;须保留本网注明的作品第一来源,并自负版权等法律责任。

          如涉及作品内容、版权等问题,请在作品发表之?#25484;?#19968;周内与本网联系,否则视为?#29260;?#30456;关权利。

          不想错过最新资讯?

          下载智能制造APP

          一键筛选来订阅

          信息更精准

          图说智能 更多


          关于我们|本站服务|会员服务|商站通服务|旗下网站|友情链接|诚聘英才|意见反馈|热词搜索|频道

          中国智能制造网 - 中国工业4.0时代智能制造领域“互联网+”服务平台

          Copyright 2019 gkzhan.comAll Rights Reserved法律顾问:浙江天册律师事务所 贾熙明律师

          客服热线:0571-87756395采购热线:0571-87759926媒体合作:0571-89719789

          客服部:采购部:编辑部:展会合作:市场一组:市场二组:

          2019广东工博会
          关闭


          关闭
          北京赛车稳赢方法

        2. <dl id="n7sq3"></dl>
              1. <dl id="n7sq3"></dl>
                    1. 134期双色球开奖结果 北单赔率为什么高 qq彩票新11选5 秒速飞艇开奖结果官网 搭扑克牌金字塔技巧 河南快3预测号码推荐 北控vs北京直播蓝球 三个半单双中特 六肖中特免费公开资料 3g网球比分直播 意甲logo图片 hi彩时时彩开奖号码 官方一尾中特网站 湖北30选5开奖查询 快乐8网址首页