<small id='tiGbWK'></small> <noframes id='gNJ039n'>

  • <tfoot id='Co8vS0X'></tfoot>

      <legend id='7wbnq'><style id='YMgBSJfo'><dir id='d3cZTo'><q id='5LwDYv'></q></dir></style></legend>
      <i id='l4t3vip'><tr id='h3tajz9m'><dt id='Sw7e'><q id='8zSTp'><span id='RNrpo'><b id='APKNnpiW'><form id='TaCWOD8RL'><ins id='PjXIg'></ins><ul id='9TYS'></ul><sub id='6Fpl'></sub></form><legend id='Flb3'></legend><bdo id='1M5c'><pre id='FZdf7O59Ql'><center id='w2l6dq9'></center></pre></bdo></b><th id='fxPoDhcZ2'></th></span></q></dt></tr></i><div id='HPXelh4q'><tfoot id='a91g'></tfoot><dl id='C3EdQj9'><fieldset id='hmR8LtnO'></fieldset></dl></div>

          <bdo id='dYsegQEZA'></bdo><ul id='S5GqL'></ul>

          1. <li id='p5Ur'></li>
            登陆

            逾越英伟达V100,这家以色列公司发布了应战GPU的AI练习芯片

            admin 2019-06-28 201人围观 ,发现0个评论

            机器之心报导

            作者:李泽南

            6 月 17 日,以色列芯片公司 Habana.ai 发布了 Gaudi HL-2000,这是一款定制化 AI 处理器。该公司称,全新的 Gaudi 处理器功能超过了现在在练习神经网络使命中最为强壮的英伟达逾越英伟达V100,这家以色列公司发布了应战GPU的AI练习芯片 Tesla V100——并且功能是后者的近四倍。

            昨日,在北京举办的人工智能大会(O'Reilly AI Conference)上,Habana 向咱们具体介绍了新产品的特性。

            Habana Labs 首席商务官 Eitan Medina 在活动中向咱们介绍了 Habana 的强壮技能。

            在这块芯片之上,Habana 也推出了 PCIe 4.0 接口板卡,以及一台 8 处理器的服务器。Habana 表明,这些设备能够成为练习超大规模数据集的根底。

            Gaudi 并不是 Habana 在人工智能芯片上的第一次测验。这家芯片公司成立于 2016 年,在上一年 9 月,Habana 曾推出名为 Goya 的人工智能推理芯片,并已具有许多客户。而在上一年 11 月,Habana 完结了价值 7500 万美元的 B 轮融资,英特尔是其领投方。

            抢先的推理芯片 Goya

            上一年 9 月,Habana 公司推出的 Goya 人工智能芯片着实招引了一把眼球。其在 Re逾越英伟达V100,这家以色列公司发布了应战GPU的AI练习芯片sNet-50 上,四倍于英伟达 灿烈Tesla T4 的处理功能,两倍的能耗比,只是 1.01ms 的处理推迟让人们感受了 ASIC 的强壮才能。

            「咱们在 2018 年 9 月发布了推理芯片 Goya,并于年末将产品面向用户。在九个月后的现在,这款产品仍然是在市场上抢先的。」Habana Labs 首席商务官 Eitan Medina 表明。

            Habana 拿出了英伟达在 GTC 上常常运用的比较方法:与现在最微弱的 GPU 比较,8 块 Tesla V100 的算力相当于 169 个传统 CPU————而相同情况下只需求 3 块 Goya 核算卡就能完结使命。

            为安在更小的功耗下,Habana 的芯片有着更强的机器学习算力?答案在于架构。「CPU 和 GPU 的架构是以处理和深度学习彻底不同的使命为导向构建的,CPU 面向通用核算,GPU 面向图形处理,」Habana 首席商务官 Eitan Medina 介绍道。「在人工智能方面,GPU 的成功几乎是『偶尔』的,因为它具有更高的并行度。但是假如你从零开始,调查神经网络的特性的话,投入满意精力,你就能够取得一个更好的架构。」这便是 Habana 正在做的事。

            Goya 是一种选用 PCIe 4.0 接口的核算卡,双槽位,全高全长,能够直接兼容现有服务器的接口,带来更强算力。Habana 表明,现在该公司现已取得了 20 余个客户,这些公司正在评价这种新类型的芯片。

            能够「无限扩展」的 AI 练习芯片 Gaudi

            人工智能的练习使命需求运用大型数据集,让模型经过前向传达、反向传达不断更新权重,然后让算法展现出「智力」。在练习模型时咱们需求侧重考虑准确度,一同存在许多数据吞吐及并行化的运算。

            而在深度学习的揣度/猜测时,模型一般只需求运用前向传达,推迟成为了重视的要点。

            不同的需求意味着只要运用不同品种的芯片才能在两个方面都完结高功率。现在,人们一般运用 CPU 处理揣度使命,GPU 用于练习,英伟达的 GPU 很长一段时刻是不分练习和推理的,但现在也有了 Tesla T4 这样专攻推理的芯片。

            Habana 很早认识到了这一点,所以其产品线分为推理和练习。

            最近推出的 Gaudi 芯片专门用于深度学习模型的练习,选用台积电 16nm 制程。在 ResNet-50 模型的练习中,其每秒能够处理 1650 张图片(batch = 64)。在完好服务器体系条件下的比照中,同为 650 个处理器,Gaudi 的处理才能是英伟达 Tesla V100 的 3.8 倍。

            这并不是 Gaudi 仅有的优势,Habana 花费许多时刻介绍了其芯片运用以太网互联的优势。「咱们以为芯片之间最好的衔接方法是 RDMA,它最早只出现在 Infinite Band 中,现在已能用于规范的以太网环境中了。」Medina 表明。

            Gaudi 是今日仅有的,能够在芯片里集成 RDMA 的芯片。并且 Gaudi 中集成了 10 个 100GbE 带宽的 RoCE RDMA 以太网端口。这意味着 Habana 的用户能够用惯例以太网环境完结扩展。这十分特别,因为其它厂商都在用特别的衔接方法,而 Gaudi 运用的是通用的以太网环境。

            比较之下,英伟达的 Tesla V100 只要 1 个 100 Gb RDMA Nic,还需求有 PCIE Switch 进行互连——而 Habana 的产品把网络端口集成在芯片内,能够完结更强的并行化。

            并行处理便是在练习过程中把使命分化到每个处理器上,再经过高速网络把运算成果联系到一同。Habana 的芯片经过以太网链接能够完结树状结构的层级化,到达挨近完美的吞吐功率。

            「DGX-2 的 NVLink 端口扩展性有限,最大支撑 16 块 GPU 的并行处理,而 Gaudi 能够支撑对外的互联,做到几百块处理器的并行化。」Medina 说道。

            在大规模并行运算的情况下,Gaudi 能够完结 Tesla V100 挨近四倍的功能。Habana 称,在单卡情况下 Gaudi 的处理速度也有 Tesla V100 的 2.7 倍,而功耗仅为后者的一半。

            在 Gaudi 与 Goya 芯片推出之后,Habana 现已具有了人工智能商业化芯片的完好处理方案。

            「从零开始规划芯片」

            Habana 的深度学习处理架构被称为 Tensor Processor Core(TPC),而 Goya 芯片中还集成了 GEMM 矩阵乘加单元,这能够让 Goya 处理不同类型的模型。

            这家公司的开发者们以为,人工智能芯片要在核算才能和推迟上都体现完美,而以往出现在许多论文中「几分钟练习 ResNet」并不是真实能够应用在出产环境中的方法。

            「在 ResNet-50 的练习上,批尺度这一参数很重要。选用 GPU 练习一般需求很大的 batch size,而 Goya 能够用很小的 batch size 完结高功率练习,在核算时能够让它设置为 1、5 和 10,这样练习推迟也能够很低。」Eitan Medina 表明。

            低推迟的体会关于自动驾驶等场景具有优势。而在云核算环境下,现在的 AI 云服务无法对单卡再做虚拟化分配,但 Goya 因为核算的推迟很低,能够把一张 Goya 卡分红 7 个部分分给用户,并坚持高功率。这样意味着 Habana 的客户能够进一步进步赢利,降低云服务价格。

            因为现在的大多数深度学习模型都在 CPU 或 GPU 上完结练习,Habana 为客户供给了一套环境,能够协助开发者快速布置产品。其软件名为 SynapseAI,支撑 ONNX、MXNet、TensorFlow、Caffe2、PyTorch 等深度学习结构与模型交流格局。

            「假如人们运用其他架构练习模型,将其布置在 Goya 的推理和猜测平台上不会有任何问题。」Medina 称。

            Habana 正尽力协助构建开源社区,因而也收到了一些报答。上一年 facebook 开源的深度学习编译环境 Glow 就首发支撑了 Habana 的芯片,此外,Linux 也已集成了 Goya 的驱动。

            关于等待运用专用芯片处理人工智能使命的公司来说,Habana 供给的芯片能够带来最大的灵逾越英伟达V100,这家以色列公司发布了应战GPU的AI练习芯片敏度。

            Habana 的愿景是成为人工智能芯片范畴的领导者。这家公司现在已有 150 名职工,其间大多数为研制人员。公司在以色列、波兰两地成立了研究中心,别的在美国加州和我国也设有分支机构。

            「练习 AI 模型所需的算力每年都以指数级增加,硬件设备有必要满意这种火急需求,并大幅进步出产力和可扩展性。凭仗 Gaudi 的立异架构,Habana 能够带来业界最强的功能,结合规范以太网衔接,完结无限的可扩展性,」Habana Labs 首席执行官 David Dahan 表明。「Gaudi 将打破人工智能练习处理器的现状。」

            未来,Habana 方案每 9 个月推出一款新产品。下一年这家公司行将推出根据 7nm 制程的新一代推理芯片。

            请关注微信公众号
            微信二维码
            不容错过
            Powered By Z-BlogPHP