电子发烧友网 > 可编程逻辑 > FPGA/ASIC技术 > 正文

云服务器FPGA架构及其电源方案初探

2020年01月09日 16:07 次阅读

作者:Cyntec

前言

随着高性能计算和人工智能技术的快速发展以及大数据的爆发式增长,人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机通过从大数据中自动学习的方法所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习www.y118.co_【官方首页】-bet365是这些领域中最常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。现有的解决方案使用图形处理单元(GPU),尽管 GPU 对深度学习算法而言在性能方面是一种更好的选择,但其功耗太高使得应用也受到很大限制。

今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供货商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

亚马逊、微软和百度等大型云端服务供货商已宣布在其超大规模数据中心部署 FPGAwww.y118.co_【官方首页】-bet365技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可程序设计性,而且还能针对任何新应用或新算法进行硬件优化。

云服务器FPGA架构及其电源方案初探

图 一 服务器部署 FPGA 的架构

随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。www.y118.co_【官方首页】-bet365FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。其实FPGA不仅在计算的加速具有良好效果,其也可以应用于数据中心存储和网络的加速,FPGA可为云服务计算、存储、网络带来综合的提升。

FPGA作为一个加速卡,已经有几十年的历史。但是在数据中心应用有所不同,FPGA首先要提供云服务,能够满足大规模部署和运维的需求,满足云服务的特性,包括远程监控管理、在线动静态逻辑的重构,也需要支持各种虚拟机访问以及支持各种驱动兼容性,整个加速卡也需要有更高的RAS特性,这些在服务器里面,可能是比较通用的性质,但是先前的FPGA加速卡,并没有这类应用场景需求,也不具备这些特性,存在很大缺失。FPGA更重要的是一种FaaS(FPGA as a Service)服务,一种方案能够将软件、算法和硬件板卡集成,以软硬一体化的形式。FaaS围绕深度学习预测、视音频处理、基因测序、金融分析、IoT等热点行业提供了非常完备的解决方案。

云服务器FPGA架构及其电源方案初探

图 二 FaaS(FPGA as a Service)

云端运算数字多台并联DC-DC电源模块,可应用之输入电压范围从8.0~15V,输出电压则为0.6~1.8V,IC操作频率为500KHz,搭载尺寸13.5x13.7mm,双组电感,感值为0.2uH电感,另为了满足数字化的需求及提供监控方法,我们采用I2C通讯协议作为客户取得模块内部信息,如下表。

云服务器FPGA架构及其电源方案初探

表 3 设计目标规格

云服务器FPGA架构及其电源方案初探

1. 电路架构

根据下图三为整合具备数字及并联能力的控制IC与高积体MOSFET及双线圈厄流器(Power Choke),透电路设计,计算出电感之感量需求,以及减少铜线线圈及磁性粉材量,进而开发出市面上大功率数字DC-DC 模块。图四为四组并联线路,依据单组模块进行并联使用,可在现有输出60A以下再增加输出电流至200A,采用PM-Bus Interface 控制方法,并且利用I2C传输接口控制各模块输出电压、侦测输出电流、温度以及控制每个模块电流均流。

云服务器FPGA架构及其电源方案初探

图三、云端运算数字DC-DC电源模块(Block diagram

云服务器FPGA架构及其电源方案初探

图四 云端运算数字DC-DC电源模块并联模式(Block diagram)

2. 电性特性比较

根据计算结果与实测分析,我司生产制作大功率数字DC-DC 产品,其效率优于市面上产品,因为我们采用堆栈制程,将电感堆栈至模块上方,利用铜柱搭接,增加电流路径,降低损耗,并且选用高积体 MOSFET 减少开关www.y118.co_【官方首页】-bet365切换的损耗,依据以上原因进而提高满载整体效率。

云服务器FPGA架构及其电源方案初探

图五、模块效率量测

3. 模块并联均流

MSN12AD60-RUD 该模块具备自动均流的功能,并且此功能再多颗模块并联时,也能够及时运算并且调整各组模块的电流一致性,防止在并联时模块发生功率不一致。图量测模块电感电流

云服务器FPGA架构及其电源方案初探

图六、模块输出电流均流

云服务器FPGA架构及其电源方案初探

图七、动态模块输出电流均流

4. PMBus通讯协议测试

因我司研发的大功率数字模块,采用PMbus通讯协议并且利用I2C传输,可以藉由PC搭配GUI与DONGLE(图19) 进而对模块进行数据读取与控制输出电压,因此这边针对该功能进行测试。

云服务器FPGA架构及其电源方案初探

图八、PMbus 系统架构

云服务器FPGA架构及其电源方案初探

图 九、GUI实测状态

www.y118.co_【官方首页】-bet365Cyntec利用GUI该套软件,可以直接监控模块目前状况以及,错误讯息,上图可以发现监测部分输入电压、输出电压以及电流与温度,右侧可以显示目前模块的状态,是否有错误讯息。

云服务器FPGA架构及其电源方案初探

图 十Labview 测试状态

Cyntec利用Labview 撰写程序仿真MCUwww.y118.co_【官方首页】-bet365在工作的时候,送入PMbus 讯号,也是可以监控模块目前状态以及系统参数。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

小梅哥FPGA设计思想与验证方法视频教程

刚刚录制了一个fpga开发流程的视频,该视频为投石问路,主要是想听听大家对于小梅哥在录制视频时需要注意的内容以及希望系列
发烧友学院发表于 2016-03-24 00:00 37952次阅读
小梅哥FPGA设计思想与验证方法视频教程

FPGA的行业优势以及它与DSP的区别分析

FPGA的优势有三个方面:1)通信高速接口设计。FPGA可以用来做高速信号处理,一般如果AD采样率高....
发表于 2020-01-10 15:46 0次阅读
FPGA的行业优势以及它与DSP的区别分析

hdmi矩阵切换器采用FPGA纯硬件架构方案

hdmi矩阵切换器在众多的领域中有着广泛的运用,对于不同的运用场合和需求,有着许多不同的方案,而dm....
发表于 2020-01-10 15:43 0次阅读
hdmi矩阵切换器采用FPGA纯硬件架构方案

关于Xilinx FPGA内部体系结构的分析

Xilinx的FPGA的基本结构是一样的,主要由6部分组成,分别为可编程输入/输出单元、基本可编程逻....
发表于 2020-01-10 15:39 0次阅读
关于Xilinx FPGA内部体系结构的分析

国产统一操作系统UOS与福昕OFD版式办公套件软...

统一操作系统 UOS 是统信软件基于 Linux 内核研发。统信软件此前表示,其已经和龙芯、飞腾、申....
发表于 2020-01-10 15:27 5次阅读
国产统一操作系统UOS与福昕OFD版式办公套件软...

AMD 7nm移动CPU依旧采用Vega系列核显...

www.y118.co_【官方首页】-bet365在CES发布会上,AMD发布了7nm的移动处理器,最高达到了8核16线程。然而,官方没有在发布会上公....
发表于 2020-01-10 14:26 71次阅读
AMD 7nm移动CPU依旧采用Vega系列核显...

如何用乘加器(mac)实现150个数平方和?

这个模块是music算法中的协方差矩阵中的一部分。输入的150个数是16位的,得到的结果是32位。 自己也写了代码可是结果...
发表于 2020-01-10 10:57 90次阅读
如何用乘加器(mac)实现150个数平方和?

自动驾驶技术需要解决什么难题

Orin芯片的诞生解决了自动驾驶发展过程中的两大问题:兼容性和安全性,所体现的不仅仅是这家公司在技术....
发表于 2020-01-10 10:49 18次阅读
自动驾驶技术需要解决什么难题

通信巨头如何实现转变

随后经过不断发展,高通成为通信行业霸主,迎来了自己的垄断时代。
发表于 2020-01-10 10:28 23次阅读
通信巨头如何实现转变

深维科技荣获北航全球创新创业大赛二等奖

经过初赛、复赛的激烈对决和层层选拔,深维科技参赛项目“超高性能数据中心FPGA异构计算加速解决方案”....
发表于 2020-01-10 09:28 39次阅读
深维科技荣获北航全球创新创业大赛二等奖

AMD苏姿丰自信表示Zen2是当前最好的CPU核...

在CES 2020展会上,AMD正式推出了7nm工艺的锐龙4000系列APU处理器,还有RX 560....
发表于 2020-01-09 14:28 159次阅读
AMD苏姿丰自信表示Zen2是当前最好的CPU核...

CPU工艺与性能之间存在着什么样的关系

5nm工艺问世,CPU工艺与性能是一种什么样的关系
发表于 2020-01-09 14:03 289次阅读
CPU工艺与性能之间存在着什么样的关系

【雨的FPGA笔记】基础知识-------构成

经典的岛型结构 FPGA由三个部分构成:实现逻辑电路的逻辑块(LB)、与外部进行信号输入/输出的I/O块(...
发表于 2020-01-09 11:01 303次阅读
【雨的FPGA笔记】基础知识-------构成

FPGA新手

学了二三个月,但是总是感觉学的不行。请问应该怎么学呢,写代码没有思路...
发表于 2020-01-08 19:37 135次阅读
FPGA新手

LVDS技术的应用优势及基于FPGA实现远端显示...

LVDS接口又称RS-644总线接口,是20世纪90年代出现的一种数据传输和接口技术。LVDS是一种....
发表于 2020-01-08 16:40 393次阅读
LVDS技术的应用优势及基于FPGA实现远端显示...

帧同步系统的工作原理及如何基于FPGA实现其设计

实现帧同步的关键是把同步码从一帧帧数据流中提取出来。本设计的一帧信码由39位码元组成。其中的巴克码为....
发表于 2020-01-08 16:30 762次阅读
帧同步系统的工作原理及如何基于FPGA实现其设计

英特尔新发布Stratix 10,为可编程四核A...

FPGA在高度并行、大吞吐量数字信号处理(DSP)应用方面享有很好的声誉。过去几代FPGA器件一直稳....
发表于 2020-01-08 15:32 223次阅读
英特尔新发布Stratix 10,为可编程四核A...

微星推出Prestige 14粉色版本,搭载十代...

去年,去年情人节,雷蛇推出了粉色的灵刃笔记本,事实证明,这种“猛男配色”的非常受欢迎,6个月后,雷蛇....
发表于 2020-01-08 15:17 215次阅读
微星推出Prestige 14粉色版本,搭载十代...

变频器内部主电路分析

这些元器件包括:电阻、电容、电感、二极管、三极管、场效应管、IGBT等。连接起这些器件的重要原件就是....
发表于 2020-01-08 09:48 137次阅读
变频器内部主电路分析

AMD CES2020新公布CPU详细信息一览

CES 2020大会上,AMD正式发布了锐龙4000系列笔记本处理器,基于全新的7nm工艺、Zen ....
发表于 2020-01-08 09:29 198次阅读
AMD CES2020新公布CPU详细信息一览

英特尔在CES2020发布了哪些产品

在 CES 发布会前一天,英特尔预览了下一代 10nm 制程处理器 Tiger Lake-U 系列的....
发表于 2020-01-08 09:11 681次阅读
英特尔在CES2020发布了哪些产品

AMD推出64核128线程锐龙处理器 大幅提升了...

在今天的CES展会上,AMD正式推出了锐龙Threadripper 3990X处理器,这是首款桌面级....
发表于 2020-01-08 08:47 104次阅读
AMD推出64核128线程锐龙处理器 大幅提升了...

FPGA的复位设计分析(Verilog HDL与RTL图)

复位的目的复位的基本目的是使器件进入到可以稳定工作的确定状态,这避免了器件在上电后进入到随机状态导致跑飞了。在...
发表于 2020-01-08 06:00 298次阅读
FPGA的复位设计分析(Verilog HDL与RTL图)

微星推出5G游戏PC搭载5G基带,预计将在Q3推...

根据消息报道,微星在CES上展示了一台5G游戏PC“MEG Aegis Ti5”,搭载了i9+RTX....
发表于 2020-01-07 15:48 425次阅读
微星推出5G游戏PC搭载5G基带,预计将在Q3推...

FPGA的发展瓶颈有哪些,该如何解决

据Semico统计,FPGA市场正在逐年增长,而复合年均增长率高达38.4%,至2023年将具有55....
发表于 2020-01-07 15:23 117次阅读
FPGA的发展瓶颈有哪些,该如何解决

FPGA和GPU在深度神经网络方面谁更胜一筹

在今天的大数据时代,企业和消费者被各种来源的海量数据淹没,包括商业交易、社交媒体以及传感器或机器对机....
发表于 2020-01-07 15:08 196次阅读
FPGA和GPU在深度神经网络方面谁更胜一筹

FPGA中面积换速度该如何去实现

在FPGA中,如果要将一个采样率为480MHz,中频频率为302.5MHz的信号变频到零中频的基带信....
发表于 2020-01-07 14:45 62次阅读
FPGA中面积换速度该如何去实现

安路科技文余波:站在历史的关口,国产FPGA当自...

安路科技总经理文余波在接受采访时表示,安路科技能在FPGA市场上实现过亿的销售,证明了公司一直以来强....
发表于 2020-01-07 13:59 91次阅读
安路科技文余波:站在历史的关口,国产FPGA当自...

龙芯3A4000评测 性能已比肩AMD同期挖掘机...

近两年,国产IC产业一直备受业内外人士的关注,在商用领域国产自研芯片、国产自研系统的声势愈发浩大,龙....
发表于 2020-01-07 13:44 338次阅读
龙芯3A4000评测 性能已比肩AMD同期挖掘机...

微软提高Surface Neo应用程序开发质量的...

微软在10月2日于纽约举行的Surface发布会上推出了Surface Pro 7,Surface ....
发表于 2020-01-07 11:19 430次阅读
微软提高Surface Neo应用程序开发质量的...

AMD 7nm APU内存支持达到了LPDDR4...

AMD 官网现已公布其7nm APU,页面显示新款的U系列和H系列处理器将支持Windows Hel....
发表于 2020-01-07 10:42 771次阅读
AMD 7nm APU内存支持达到了LPDDR4...

Intel将推出升级版Lakefiled,微软S...

去年的CES上,Intel宣布了全新的3D Foveros立体封装技术和首款产品Lakefiled,....
发表于 2020-01-07 08:54 472次阅读
Intel将推出升级版Lakefiled,微软S...

FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

数据采集在现代工业生产及科学研究中的重要地位日益突出,对实时高速数据采集的要求也不断提高。在信号测量、图像处理...
发表于 2020-01-07 07:00 598次阅读
FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

请问sdram中ref_timer计数器的值的问题?

程序中第一个always块中的9位计数器ref_timer计数到0之后,会重新回到511,等到再被调用的时候,从设定计数值递减。而...
发表于 2020-01-06 20:06 223次阅读
请问sdram中ref_timer计数器的值的问题?

intel的第二代10nm桌面CPU带来了全新面...

尽管intel的十代酷睿处理器仍在使用14nm工艺挤牙膏,但是外界对于这代intel处理器的性能还是....
发表于 2020-01-06 15:41 689次阅读
intel的第二代10nm桌面CPU带来了全新面...

求助:基于FPGA的数字频率计设计

要求测量精度不低于10HZ,响应时间不高于250ms是什么意思?理解不了。 ...
发表于 2020-01-04 23:01 401次阅读
求助:基于FPGA的数字频率计设计

分享:FPGA设计原则总结

1.面积与速度的平衡与互换这里的面积指一个设计消耗 FPGA/CPLD 的逻辑资源的数量,对于 FPGA 可以用消耗的...
发表于 2020-01-01 08:00 432次阅读
分享:FPGA设计原则总结

数字信号处理的FPGA实现

数字信号处理的FPGA实现
发表于 2019-12-31 17:24 554次阅读
数字信号处理的FPGA实现

【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

本文由 发烧友研习社 服务号自主原创,版权所有侵权必究。 什么是FPGA? 也许您曾经有所耳闻,但您是否深入...
发表于 2019-12-26 12:02 945次阅读
【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

页面底部区域 foot.htm