业界| 英特尔推出Myriad™ X芯片:将人工智能引入边缘计算

机器之心 2017-09-13 09:57 阅读:143
摘要:机器之心发布机器之心编辑部首个拥有专用神经计算引擎的视觉处理单元,将赋予设备实时观察、理解周围的世界,并与其进行交互的能力。RemiEl-Ouazzane,英特尔新技术事业部副总裁兼Movidius部

机器之心发布

机器之心编辑部



首个拥有专用神经计算引擎的视觉处理单元,将赋予设备实时观察、理解周围的世界,并与其进行交互的能力。



Remi El-Ouazzane,英特尔新技术事业部副总裁兼 Movidius 部门总经理



在我的整个职业生涯中,我一直在想象未来技术会把我们带向何处,在英特尔工作之后这种想法出现的频次比以往任何时候都高,而能够用自己的双手创造未来更是激动人心。今天,随着 Myriad™ X 的推出,那个我曾想象过的未来已经到来。Myriad™ X 是世界上第一个拥有专用神经计算引擎的视觉处理单元(VPU),能够以惊人的低功耗和高性能将人工智能引入边缘计算。



在未来的几年里,我们将看到大量新的产品出现,通过在设备(从无人机和智能摄像机到增强现实等等)中嵌入实时智能功能,这些产品能够实现更高程度的自主化,能够观察、理解周围的环境,并且能够与快速变化的环境进行交互,从中学习经验。



Myriad™ X 将专用的成像、计算机视觉以及高性能深度学习推理(这一点要感谢业界首个神经计算引擎)结合在同一个芯片中,然后开辟了新的充满潜力的领域。通过将这种更快、更普及的智能直接嵌入到设备中,人类将使我们的世界变得更安全、高效和更具个性化。从自动送货无人机和拥有情景理解能力的安全摄像机,到具有情境和情感意识的个人机器人,Myriad™ X 将为智能和自主设备的新未来提供无数个创新机会。



为了实现这一点,我们消除了设备与云端通信在时间和功能上的限制,并在设备级别启用了深度学习。这是 VPU 的力量所在——Movidius™ 平台经专业设计,用来应对自主设备面临的挑战。我们的小型 VPU 能够将视觉智能直接放置在设备上,同时可以以超低功耗阈值提供行业领先的计算性能。



自一年前加入英特尔家庭之后,我们一直非常期待这一天的到来,无论其间时间如何飞逝。在英特尔多样化的专业环境中——从人工智能产品事业部和物联网事业部,到英特尔实验室和实感团队,我们已经具备对我们的技术进行扩展的能力,并能够将深度学习的性能引入边缘计算,因而我们可以将 Myriad™ X 带入一个更美好、发展更迅速的行业中。



而且我们才刚刚开始......



我们将继续利用英特尔独一无二的能力,将端到端的人工智能解决方案从云端引入边缘计算,在此过程中,我们必须提供一个 VPU 技术路线图,它需要能够在不牺牲功耗的前提下大幅提高边缘计算计算的性能。



下一个十年中,我们可以看到全新类别设备的诞生,我们已经迫不及待地想看到由 Myriad™ X 所带来的创新。



正如 Saint-Exupéry 所说:「对于未来,你的任务不在于预见它,而是要实现它。」



什么是 Myriad™ X?





Myriad™ X 是全球第一个配备专用神经网络计算引擎的片上系统芯片(SoC),用于加速设备端的深度学习推理。该神经网络计算引擎是芯片上集成的硬件模块,专为高速、低功耗且不牺牲精确度地运行基于深度学习的神经网络而设计,让设备能够实时地看到、理解和响应周围环境。引入该神经计算引擎之后,Myriad™ X 架构能够为基于深度学习的神经网络推理提供 1 TOPS 的计算性能。



Myriad X 可以提供超过 4 TOPS 的总体性能表现,其微型的尺寸和板载处理能力非常适合自主设备解决方案。除了神经计算引擎,Myriad X 通过如下方式独特地实时整合了成像、视觉处理和深度学习推理:



  • 可编程 128 位 VLIW 向量处理器:通过为计算机视觉工作负载而优化的 16 个向量处理器可以灵活地同时运行多个成像和视觉应用流水线。

  • 增加可配置的 MIPI 通道:通过其一套丰富的接口和 16 个 MIPI 通道,可以把多达 8 个高清 RGB 摄像头直接连接到 Myriad X,从而支持最高每秒 7 亿像素的图像信号处理吞吐量。

  • 强化的视觉加速器:利用超过 20 个硬件加速器来执行光流和立体深度等任务,而不需要额外的计算开销。

  • 2.5 MB 的多核异构同质片上内存:集中化的芯片内存架构最高支持每秒 450 GBytes 的内部带宽,通过尽量减少芯片外部数据传输进而最小化数据访问的延迟并降低功耗。



Myriad™ X 是最新一代 Movidius VPU,专为嵌入式视觉智能和推理开发设计。Movidius VPUs 通过整合三种架构能够在低功耗的情况下实现高性能,从而为深度学习和计算机视觉工作负载提供持续的高性能:



  • 一组可编程 VLIW 向量处理器,其中的指令集为计算机视觉和深度学习工作负荷进行了优化;

  • 一套硬件加速器可以支持图像信号处理、计算机视觉和深度学习推理;

  • 通用的智能内存结构,用于把芯片上的数据搬移量降至最低。





本文为机器之心发布, 转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告&商务合作:bd@jiqizhixin.com

版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 143
0