大数据和机器学习AI芯片：GPU vs FPGA 云和本地部署的艰难选择

发布时间：2018-09-01 08:59:18 所属栏目：云计算来源：云技术实践

导读：GPU和FPGA如何帮助执行数据密集型任务，例如操作，分析和机器学习，以及有哪些选择？应用程序和基础架构在逐步发展。这是人工智能再生的时代，基础设施既可以使人工智能应用程序理解世界，也可以不断发展以更好地满足需求。通常情况下，我们已经设想了为

副标题[/!--empirenews.page--]

GPU和FPGA如何帮助执行数据密集型任务，例如操作，分析和机器学习，以及有哪些选择？

应用程序和基础架构在逐步发展。这是人工智能再生的时代，基础设施既可以使人工智能应用程序理解世界，也可以不断发展以更好地满足需求。

通常情况下，我们已经设想了为AI应用程序提供动力的新基础架构，并且在它完全成熟之前给出了名称 ------ Infrastructure 3.0。我们也开始探索堆栈中多方面组成部分，包括哪些明显的、不那么明显的，以及其他部分。

为了易于阐述，本文将聚焦“具有许多计算核心和高带宽内存的专用硬件”，简称AI芯片。我们来看看这些AI芯片如何在数据库和分析以及机器学习（ML）方面使以数据为中心的任务受益。

让我们从GPU和FPGA来开启这篇文章的介绍。

GPU

图形处理单元（GPU）已经存在了一段时间。最初设计是用于满足快速渲染的需求，主要用于游戏行业，GPU的架构已被证明能够与机器学习良好匹配。

GPU的并行处理，这也是CPU可以做的事情，但与通用CPU相反，GPU的专业性使它们能够跟上摩尔定律的速度继续发展。Nvidia是GPU领域的主要参与者，最近宣布了一套基于Turing架构的新GPU。

为避免淘汰，新的Nvidia GPU实际上带来了图形渲染的改进。但是，更重要的是，为了契合需求，他们收集了Tensor Cores，这是该公司专门的机器学习架构，并介绍了NGX。NGX是一种技术，正如Nvidia所说，它将人工智能引入图形管道：“NGX技术带来了诸如采用标准摄像机输入和创建超级慢动作等功能，就像你使用一个价值10万美元以上的专用摄像机那样。”

人们一般不会对通用机器学习（ML）感兴趣，但新Nvidia卡的功能肯定能引起人们的关注。然而，它的价格也反映了产品的高端品质，从2.5K到10K美元不等。

GPU可以极大地加速工作负载，这些工作负载可以分解，并行执行，与CPU协同工作。图片：SQream。

但是，利用GPU，不仅需要硬件架构 ---- 它还需要软件。对于Nvidia来说，这是有利的竞争因素，而对于像AMD这样的竞争者来说却显然不利。Nvidia在使用GPU进行机器学习应用方面遥遥领先的原因在于使用GPU所需的库（CUDA和cuDNN）。

AMD虽然也有一个可以与AMD GPU一起使用的替代软件层，称为OpenCL，但它的成熟度和支持程序与Nvidia的库尚有差距。AMD正在努力迎头赶上，它也在硬件方面展开布局。

为了从AI芯片中受益，AMD所需的投资超出了硬件。迫切需要一个位于这些芯片之上的软件层，以优化在其上运行的代码。没有它，它们几乎无法使用。但是，这也需要使用者学习如何使用这一层。

上面，我们已经提到GPU如何成为ML工作负载的首选AI芯片。最受欢迎的ML库支持GPU - Caffe，CNTK，DeepLearning4j，H2O，MXnet，PyTorch，SciKit和TensorFlow等。除了需要了解每个库的细节之外，通常还需要构建GPU环境。

至于普通的数据操作和分析 -----GPU数据库方面，已经开发出一类新的数据库系统，其目标是利用GPU并行性，将现成硬件的优势带入主流应用程序开发。这个领域可以选择BlazingDB，Brytlyt，Kinetica，MapD，PG-Strom和SQream。

FPGA

现场可编程门阵列（FPGA）并不是新的产品----自80年代起就存在。它们背后的主要思想是，与其他芯片相反，可以按需重新配置。读者可能更想知道这是如何实现的，如何更专业化，以及有什么用处。

FPGA可以简单地被认为是包含低级芯片基础的电路板，例如AND和OR门。通常使用硬件描述语言（HDL）指定FPGA配置。使用此HDL，可以以符合特定任务或应用程序要求的方式配置基础架构，实质上是模仿特定应用集成电路（ASIC）。

由于必须通过HDL为每个不同的应用程序重新编程，芯片听起来很复杂。因此，软件层至关重要。根据Tirias Research首席分析师Jim McGregor的说法，“构建FPGA的工具集有些古老。Nvidia在使用GPU时很好地利用了CUDA语言。利用FPGA，仍然是一种有效构建算法的黑马。”

英特尔非常重视FPGA，可能是为了弥补其在GPU中落后的局势。但FPGA软件层还没有GPU那样成熟。图像：英特尔

但上面这种情况正在悄然发生改变。最初是英特尔对FPGA表示了兴趣，收购了Altera（关键的FPGA制造商之一）。这可能是英特尔推进AI芯片世界的战略，这一点在与GPU竞争中处于劣势之后将变得越来越重要。但是，抛开复杂性，FPGA有竞争力吗？

英特尔最近发布了针对NVIDIA Titan X Pascal GPU在两代英特尔FPGA（英特尔Arria10和英特尔Stratix 10）上评估新兴深度学习（DL）算法的研究成果。这项研究的要点是，当使用紧凑数据类型与完整32位浮点数据（FP32）时，英特尔Stratix 10 FPGA优于GPU。

这意味着只要使用低精度数据类型，英特尔的FPGA就可以与GPU竞争。听起来很糟糕，但它实际上是DL的新兴趋势。理由是简化计算，同时保持可比较的准确性。

将FPGA用于机器学习（ML）有光明前景。然而，今天，发展并不是那么顺利。在验证McGregor的声明时，似乎没有一个支持FPGA的ML库开箱即用。目前正在开展使用TensorFlow实现FPGA的工作，但除此之外几乎没有什么其他工具。

然而，在数据操作和分析方面，情况有所不同。最近，英特尔展示了其与FPGA加速分析合作的一些合作伙伴。 Swarm64看有望为PostgreSQL，MariaDB和MySQL加速12次。另外，rENIAC可以提供Cassandra的13倍加速版本，以及Algo-Logic及其定制键值存储。

在云端和本地部署中抉择

选用何种新兴技术很难抉择，硬件也不例外。项目研发中，是应该构建自己的基础架构，还是使用云？是应该等到产品变得更加成熟再使用，还是立即使用产品，成为早期采用者而受益？是选择GPU，还是FPGA？是选择哪个GPU或FPGA供应商？

（编辑：好传媒门户网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/3

尾页

达摩院发布AI遥感分析	多云时代，云间迁移应
七步做好云计算基础设	探查云原生数据库