GPU系统工程师是做什么的的

solidworks | PHP | c4d | 细胞生物学 | HTML | 冬奥会 | 基因 | 营销策划 | 扫地机器人 | 武侠 | 大学生就业 | 电学 | 国航 | 电子技术研发 | 几何学 | 外星人 | 语言学 | 秦时明月之天行九歌 | 金融数学 | 三国人物 | 休学 | 小店区 | 杨紫 | 植保无人机 | CSS | 陶渊明 | 少数民族 | AutoCAD | 3d打印机 | 香港购物 | 日语语法 | 对联 | matlab | 按键精灵 | 粉丝（Fans） | 语言学习 | 总决赛 | 驾驶经验 | Spss数据分析 | 日本漫画 | 数学建模 | 道德 | 项目管理 | 背景音乐（bgm） | 云主机 | 3D Max | onenote | 游戏原画 | 科学 | 网站建设 | 热血传奇（游戏） | 身高 | 网站运营 | 道教 | 社会学 | 迅雷（软件） | 爬虫（计算机网络） | O2O | 运载火箭 | 遗传学 | 率土之滨 | 百度输入法 | 极限挑战(综艺节目) | 电梯 | 女性主义 | Adobe After Effects | mysql | 办公软件 | 法国 | ps3 | 化学实验 | QQ群 | 中国中央电视台 | 前女友 | 性格 | 免费软件 | 分子生物学 | 金庸小说 | 留学生 | Microsoft SQL Server | 龙珠 | 设计院 | C#编程 | 虚拟机 | 字幕 | 微信群 | 创业项目 | 祛痘 | 图形处理器（gpu） | Microsoft Visual Studio | 动物保护 | C/C++ | facebook | 秦岭 | 燕窝 | 人性 | 下载 | 驾驶技术 | 大学数学 | 封神演义 | 整容 | 西装 | 马克思主义哲学 | 计算机专业 | pdf | thinkpad | 代理 | 参考文献 | 江苏大学 | 游戏手柄 | 城市规划 | 黑洞 | 旅行 | CAD制图 | 风水 | 直播 | 快捷键 | 编辑器 | 机器学习 | 暴走大事件 | 球球大作战 | unity（游戏引擎） | 永恒之塔 | DJI大疆创新 | 传统文化 | wordpress | 仙剑奇侠传（游戏） | 国际物流 | 安徽 | 配音 | 猎头公司 | 在线教育 | 欧洲冠军联赛 | ios游戏 | 洛奇英雄传 | 暗恋 | 网盘 | 星座爱情 | 剧场版 | 面相 | 讯飞输入法 | 记忆力 | 超级战队 | stm32 | 亚马逊中国 | Apple ID | 服装设计 | 网络主播 | 品牌营销 | 情侣 | 新加坡 | 调酒 | 雷欧奥特曼 | 花样姐姐 | 物联网 | 任天堂3ds | 易经 | 户型 | 流氓软件 | 圣经 | 进化 | 垃圾分类 | 函数 | 星际穿越（电影） | 山东工艺美术学院 | 优酷视频 | github | 舰队 Collection | 流行音乐 | 进击的巨人 | playstation vita | 科学研究 | 欢乐麻将 | 史莱姆 | 海关 | Internet Explorer | 刑事案件 | 取名 | 江苏银行 | eDonkey网络 | 表情包 | mfc | 大学军训 | 诸葛亮 | Apple WATCH | 嵌入式系统 | 私募证券投资基金 | iOS应用 | 对外经贸大学 | 最强大脑（电视节目） | 青蛙 | 日本代购 | 巧克力 | 天涯明月刀ol（游戏） | 食用油 | 曹操 | SEO | 生命 | 乌贼 | 我的英雄学院 |

你的位置：网站首页 >> 频道首页 >>硬件 >>GPU系统工程师是做什么的的

GPU系统工程师是做什么的的

来源：蜘蛛抓取(WebSpider) 时间：2018-05-30 05:45 标签： etl工程师是做什么的

现在的位置:
谷歌硬件工程师一文解读：TPU为何会比CPU、GPU快30倍？
在谷歌发布TPU一年后，这款机器学习定制芯片的神秘面纱终于被揭开了。昨日，谷歌资深硬件工程师Norman Jouppi刊文表示，谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍（和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU），而在能效上，TPU更是提升了30到80倍。
从这次发布的测试结果来看，TPU似乎已经超出了业界的预期，但是藏在这一芯片背后的内部架构究竟有什么秘密呢，我们从Jouppi此前发布的论文当中，可以找到答案。
据了解，早在四年前，谷歌内部就开始使用消耗大量计算资源的深度学习模型，这对CPU、GPU组合而言是一个巨大的挑战，谷歌深知如果基于现有硬件，他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。
所以谷歌开始研发一种新的架构，Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一，他开创了内存系统中的新技术。三年前他加入谷歌的时候，公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。
Jouppi表示，谷歌的硬件工程团队在转向定制ASIC之前，早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出，FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说，“TPU可以像CPU或GPU一样可编程，它可以在不同的网络（卷积神经网络，LSTM模型和大规模完全连接的模型）上执行CISC指令，而不是为某个专用的神经网络模型设计的。一言以蔽之，TPU兼具了CPU和ASIC的有点，它不仅是可编程的，而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。
TPU的内部架构
该图显示了TPU上的内部结构，除了外挂的DDR3内存，左侧是主机界面。指令从主机发送到队列中（没有循环）。这些激活控制逻辑可以根据指令多次运行相同的指令。
TPU并非一款复杂的硬件，它看起来像是雷达应用的信号处理引擎，而不是标准的X86衍生架构。Jouppi说，尽管它有众多的矩阵乘法单元，但是它GPU更精于浮点单元的协处理。另外，需要注意的是，TPU没有任何存储的程序，它可以直接从主机发送指令。
TPU上的DRAM作为一个单元并行运行，因为需要获取更多的权重以馈送到矩阵乘法单元（算下来，吞吐量达到了64,000）。Jouppi并没有提到是他们是如何缩放（systolic）数据流的，但他表示，使用主机软件加速器都将成为瓶颈。
256×256阵列缩放数据流引擎，经过矩阵乘法积累后实现非线性输出
从第二张图片可以看出，TPU有两个内存单元，以及一个用于模型中参数的外部DDR3 DRAM。参数进来后，可从顶部加载到矩阵乘法单元中。同时，可以从左边加载激活（或从“神经元”输出）。那些以收缩的方式进入矩阵单元以产生矩阵乘法，它可以在每个周期中进行64,000次累加。
毋庸置疑，谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如，使用高带宽内存或混合3D内存。然而，谷歌的问题在于保持分布式硬件的一致性。
TPU对比Haswell处理器
在和英特尔“Haswell”Xeon E5 v3处理器来的对比中，我们可以看到，TPU各方面的表现都要强于前者。
在Google的测试中，使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算，并提供51GB/秒的内存带宽；Haswell芯片功耗为145瓦，其系统（拥有256 GB内存）满载时消耗455瓦特。
相比之下，TPU使用8位整数数学运算器，拥有256GB的主机内存以及32GB的内存，能够实现34GB/秒的内存带宽，处理速度高达92 TOPS ，这比Haswell提升了71倍，此外，TPU服务器的热功率只有384瓦。
除此之外，谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。
如上图所示，在小批量任务中（16），Haswell CPU的响应时间接近7毫秒，其每秒提供5482次推断（IPS），其可以实现的最大批量任务（64）每秒则可以完成13194次推断，但其响应时间为21.3毫秒。相比之下，TPU可以做到批量大小为200，而响应时间低于7毫秒，并提供225000个IPS运行推理基准，是其峰值性能的80％，当批量大小为250，响应时间为10毫秒。
不过需要注意的是，谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题，英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5，每核心时钟（IPC）的指令比这款处理器提升了约5％。在Skylake是28核，而Haswell为18核，所以Xeon的总体吞吐量可能会上升80％。当然，这样的提升与TPU相比仍有差距。
最后需要强调的是，TPU是一个推理芯片，它并非是要取代GPU，可以确定的是，TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言，如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。
Jouppi表示谷歌TPU已经开始出货，而英特尔这些芯片商也将面临更大的挑战。
本文原文地址：http://www.eeboard.com/news/tpu-cpu-gpu/
搜索"爱板网"加关注，每日最新的开发板、智能硬件、硬件、活动等信息可以让你一手全掌握。推荐关注！
【微信扫描下图可直接关注】
科技早知道：
【上篇】【下篇】
推特爆料人Pau Curcio分享了一张号称是谷歌Pixel 3的“官方渲染图”。考虑到Pau还是爆料圈素人且没有其它信息佐证，权当一个早期的参考。
近日，推特用户Pau Curcio分享了的一张Pixel 3的“官方宣传图”，但毕竟Pau还是爆料圈素人所以真实性有待考证。而就在1小时前，知名爆料人士@VenyaGeskin1在推文中晒出了Pixel 3和Pixel 3 XL的...
Google Chrome 谷歌浏览器
作为八代酷睿家族中特殊的一员，Intel Kaby Lake-G史无前例地整合了AMD GPU，实现了两大死对头的合体，图形性能达到了千元独立显卡的档次。
我们常说在商业中，没有永远的朋友也没有永远的敌人，只有永恒的利益。在PC芯片领域英特尔和AMD一直是相互竞争的，两家的处理器一直是CPU的唯二选择
高通预计将于下周在加州圣克拉拉举行的“扩大世界博览会”期间展示一款专门用于独立VR头盔的新处理器。这款名为Snapdragon XR1的芯片将由CPU核心、图形处理器、专用于安全的组件和人工智能组成。
您必须才能发表留言！没有更多推荐了，
不良信息举报
举报内容：
【实习】GPU计算高级工程师的实习面试经验分享
举报原因：
原文地址：
原因补充：
最多只允许输入30个字
加入CSDN，享受更精准的内容推荐，与500万程序员共同成长！【GPU工程师招聘网_GPU工程师相关的招聘信息】 -智联招聘
GPU工程师热门城市：
GPU工程师招聘相关信息
GPU工程师友情提醒
智联GPU工程师招聘信息页面为您提供：更新、更全的GPU工程师招聘信息，除此之外还有更多关于GPU工程师相关职位的招聘信息和其他热门职位信息。智联招聘秉承于满足您的求职需求，让您更快、更满意的找到GPU工程师的工作。
热门职位招聘北京GPU工程师-北京昌平区-百度百聘
北京GPU工程师
北京GPU工程师
北京-北京市昌平生命科学园博雅CC4号院5号楼
来源：内推网
百度百聘温馨提示：
（1）以上职位信息均来自第三方网站，不代表百度。（2）如对该职位非本公司发布，请联系第三方网站进行删除，百度会积极协助配合。（3）在签订合同之前，以各种理由收取非正规费用的（如押金、报名费、服装费等）均有诈骗嫌疑，请您保持警惕。
该公司还在招聘
北京贝瑞和康生物技术有限公司
公司性质：有限责任公司(法人独资)
公司类型：科技推广和应用服务业
工作地点：北京市昌平区科技园区生命园路4号院5号楼8层801
公司官网：
手机百聘扫一扫
随时随地找工作
您尚未登录，暂时无法收藏心仪的职位，请登录后收藏。
您尚未登录，暂时无法直接投递全网职位，登录即可直投全网职位
您已收藏成功,请在"我的收藏"中查看
请完善简历
您尚未完善简历，暂时无法使用百度帐号投递全网职位功能
恭喜您职位申请成功，请耐心等待企业联系！
分享到微信朋友圈
打开微信，点击底部的"发现"，
使用"扫一扫"即可将网页分享至朋友圈。

GPU系统工程师是做什么的的

我要回帖

更多关于 etl工程师是做什么的的文章

随机推荐

GPU系统工程师是做什么的的

我要回帖

更多关于 etl工程师是做什么的 的文章

随机推荐

更多关于 etl工程师是做什么的的文章