随着摩尔定律现在还适用吗的发展计算能力逐步得到解放什么性能分数提升c最初用来训练深度

原标题:数字经济核心科技深度報告:AI+5G是数字时代通用技术平台

核心层:数字经济发展的底层建筑

核心层的范畴及其经济含义

从宏观视角看核心层是支撑数字经济发展嘚底层建筑。这个基座主要包括(1)体、 (2)信息技术(IT)、(3)通信技术、(4)智能硬件四个领域在这一基座中,半导体 作为最本质嘚计算、存储硬件单元发挥了砖瓦的作用,支撑数据处理功能的实现生 产了更多可交互、有价值的数据信息。信息技术相当于基座的架构通过软件手段赋能 核心层运转,决定了数据传递、价值创造的效率通信技术是基座建筑中的连接管道, 在核心层中发挥信息传输載体的作用智能硬件相当于核心层的“网络神经末梢”,通过 人机交互方式获取信息、展示信息实现经济活动主体与核心层中数据信息的交互,或 是与其他硬件交互、收集新的数据

具体而言,核心层技术迭代是数据特殊属性的根基正是在核心层技术的不断迭代中, 財在软硬件层面实现了信息的存储、计算、传输成本的指数型下降从而降低了数字经 济活动中的搜索成本、复制成本、传输成本、追踪荿本和验证成本。而数据作为数字经 济时代的生产要素造就了数字经济非竞争性、规模经济、网络效应、范围经济等特殊

半导体是数字經济核心层发展的基石,“摩尔定律现在还适用吗”推动产业长期迭代创新过去 50 年,半导体在价格几乎不变的前提下单位面积可容纳嘚元器件数目每隔约 18 个月便会增加一倍(摩尔定律现在还适用吗),成为推动生产率提升的重要动力之一全球半导体 市场主要包括半导體设计,晶圆代工、封测、设计软件(EDA)、设备、半导体材料 等环节其中美国企业在设计软件、半导体设备等环节占据主导地位。未来半导 体的发展,会推动(1)云端数据中心算力、(2)AI 算力、(3)5G 上层应用等市场 的快速增长

信息技术代表数字经济核心层的架构,ABC(囚工智能、区块链、云计算)推动社 会数字化转型PC 时代下,计算机和互联网开始走近个人消费者搜索引擎、门户 网站、电子商务等网站兴起,人类社会开始真正进入信息时代;而在移动互联网时 代伴随着智能移动终端的普及,苹果 App Store、谷歌 Play Store 应用商店的快速 发展使得移動支付、打车、订餐外卖、共享单车等服务的数字化成为可能。自 2015 年英伟达与亚马逊等公司提出“云+AI”概念后下一代通用计算平台的变革正在发 生。根据 IDC2019 年全球公有云市场达到 2,334 亿美元(同比增长 26%);根据 Gartner, 2019 年企业软件市场规模达到 4,770 亿美元

通信技术是数字经济核心层的連接管道,4G 到 5G 改变社会从 2G 到 5G,信息传 输阻力不断减小手机通信的带宽 0.1MB/s 提升至最高 10G/s,时延从 500ms 降至 1ms;同时通信流量资费却不断下降更加恏用、便宜的通信技术,催生微信、手 游、移动电商、短视频等新应用改变了我们生活的方方面面的同时,也不断推动 智能终端的升级換代展望 5G 时代,高频段、高密度的基站能够处理大量接入信号 网络的能源利用更加高效,支持海量智能终端的通信需求我们预计有朢实现万物 互联,推动社会变革;而物联网、车联网、卫星互联网等新型连接技术也有望更进 一步发展根据 Gartner,2019 年全球用于通信服务的开支规模达到 13,720 亿美元;基础设施侧全球无线网络基础设施市场规模约为 359 亿美元。主设备环节中华 为、中兴、爱立信和诺基亚形成了四分忝下的垄断竞争格局。

智能硬件是数字经济核心层的“神经末梢”交互方式变革拓展数字技术应用边界。交互方式的升级是智能硬件迭玳升级的主线回顾历史,我们看到从键盘(按动)、 触摸屏(多点触摸)、AI 语音助手(语音)到 ARVR(光学)、脑机接口(神经电信 号),每一轮交互方式的升级均带来交互带宽和数据量的大幅提升亦不断拓宽数字 技术的应用范围,连接量级正走向万物互联从科技硬件嘚演进来看,每 10-15 年 出现一轮大的科技硬件创新周期我们认为下一个 10 年的接入信号创新周期正在开 启,根据我们预测2019 年全球智能硬件市場规模约为 8,355 亿美元,以 8%的 CAGR 增长至 2025 年的 13,126 亿美元;其中 AIoT 行业市场规模约为 1,578 亿美元以 21% 的 CAGR 增长至 2025 年的 4,892 亿美元,超过智能手机而从广义的 AIoT(AIoT+ 汽车電子)来看,2023 年市场规模就将超过智能手机其中 TWS、智能手表、智能 音箱、ARVR、智能汽车等品类成长值得期待。

过去三十年科技行业的通鼡技术平台经历(1)从主机到个人电脑;(2)从个人电脑到 手机;(3)从手机到 AI 云计算的三次重大迭代。这几次变革中通信技术从最初嘚专网, 升级为有线互联网、4G 和 5G;计算架构从最初的集中式到 PC 和手机的分布计算,由 AI 云计算时代又回归到集中式计算展望未来,基于汾布式架构的区块链+物联网是否成 为云计算之后的通用技术平台受到广泛关注

每次技术的变革都包括一批重要的科技企业的崛起。这包括主机时代的 IBMPC 互联网 时代的微软和 Intel(Wintel 联盟),到移动互联网时代的苹果、ARM、谷歌和 AI 云计 算时代的亚马逊、微软和英伟达。

主机时代(集中式计算):上世纪 90 年代以前伴随金融体系 IT 化进程,高可靠性、 高完整性、强一致性的集中式计算得以快速发展以 IBM 为代表的企业推絀的软硬 件一体的大型主机(Mainframe)成为算力的主流,受到金融等大企业的支持但高 昂的价格限制了其普及。大型机最初是指装在非常大的帶框的铁盒子里的大型计算机 系统;随着芯片的集成度越来越高小型计算机的计算性能逐渐增强,大型机的市场 占有率面临严峻挑战

PC 時代(分布式计算):上世纪末、本世纪初开始,伴随半导体成本的大幅下降以 及个人互联网(有线网络为主)的出现,以微软和 Intel 为代表的个人电脑平台开始 普及Wintel 联盟(Microsoft Windows + IntelCPU)出现,微软和 Intel 推行的软硬件 分离的商业模式成为主流并逐渐取代了 IBM 在主机时代的主导地位。硬件層面Intel 在摩尔定律现在还适用吗下不断提升 CPU 算力,微软则相应对 Windows 系统快速升级换代强强 联合推动 PC 行业不断迭代,PC 产品的发展日新月异

迻动互联网时代(分布式计算):2007 年 1 月苹果发布第一代 iPhone,开启智能手机 与移动互联网时代算力载体进一步从固定的电脑端向便携移动的掱机端转移。苹果 推行的软硬件一体模式与谷歌推行的安卓操作系统+ARM 芯片的软硬件分离成为两 大主要模式

人工智能+云计算时代(集中式計算):云计算最早由亚马逊在 2006 年推出,为企业 提供了一种按需索取、按量计费的计算和存储服务帮助企业应对突发的需求变化, 降低 IT 支出云计算平台能够汇聚大量数据,并为人工智能发展提供基础随着技 术的发展,其优势受到重视AI+Cloud 也逐渐成为通用计算平台。

下一個时代或是区块链+物联网(分布式计算):在人工智能+云计算时代我们认为 一方面数据的价值不断凸显,已成为数字经济时代的“石油”;另一方面数据越来 越集中于少数互联网巨头/云计算厂商手中,“数据孤岛”问题日益突出数据的跨国 界流通也成为科技企业跨国匼作的难题之一。我们认为大数据立法是规范和促进数据使用的先决条件,而由区块链+物联网驱动的数据资产交易平台的建设有望促進 数据流通、提高数据使用效率,充分发挥数据整合后的潜在价值

核心层企业在全球经济中占比不断上升

核心层包括硬件、软件、信息囷通讯技术等行业,其中硬件领域以半导体和电子制造行 业最为重要从数字经济的角度理解,核心层是数字经济的重要基础环节根据Φ国信数字,我国 2019 年包括互联网在内的数字产业化增加值规模达到 7.1 万亿元占 GDP 比重达到 7.2%。数字经济核心层既是数字经济的重要组成部分叒是支撑上层平台经济 和行业应用的重要支柱。

过去 10 年在 4G 移动互联网大发展的背景下,包括硬件制造、软件、信息服务在内的 核心层产業得到快速发展信息技术行业在实体经济和资本市场的重要性不断彰显。以 美国为例包含软硬件设备以及互联网企业的美国信息技术公司(相当于下图核心数字 部门和狭义数字经济)在全部美股的市值占比在过去 10 年上升了 15ppt 至 27%,同期能 源行业的总市值占比明显下降中国市场表现出更为明显的“剪刀差”走势,在全部 A 股+港股+美国中概股市场中的信息技术类企业的市值占比从 2010 年的 9%,增长 13.4ppt 至 2020 年 7 月的 22.4%;同期能源企业市值占比下滑 16.9ppt

经过近一个世纪的全球产业转移,目前全球核心层领域的格局基本形成1)美国在云计 算、互联网服务、软件、半導体等处于全球领先地位;2)日韩以电子元器件、半导体为 主,其中日本偏向电子元器件韩国侧重半导体;3)中国台湾以半导体代工及電子元器 件为主;4)中国大陆以通信设备、电子元器件、互联网服务等为主;5)随近年来产业 转移,越南、印度承接部分组装与零组件业務

总体来看,经过 30 年发展在 5G(通信技术)、AI 应用、硬件制造等科技领域中国具备 全球领先优势;但半导体、软件等领域中国仍存在较夶差距。以下分行业具体阐述

过去十年,中国在零部件、通信设备、互联网服务能力提升明显通过对全球四千余家 科技行业上市公司嘚整理分析,我们看到十年间中国(含香港)在科技行业各个领域 的收入占比都有所提升,其中通信设备、电子元器件、互联网服务的提升显著在云计 算、半导体、软件上也有所提升。目前美国在云计算、互联网服务、软件、半导体等环 节上仍然在全球占据领先地位,其中美国公司在半导体环节占据 40%以上的收入份额

中国半导体的差距在哪里?

半导体:从芯片产品来看得益于科创板的设立及华为进ロ替代需求的带动,过去几年 国内芯片设计公司发展迅速目前国产芯片设计公司已对主要中低阶产品实现了国产替 代。但是在一些专利/技术壁垒高、资本投入大、行业高度垄断的如处理器(CPU/GPU)、 存储器等领域份额仍然十分有限高度依赖从美、韩、日等地进口。从产业链環节来看 国内目前中芯国际与台积电仍有 3 代/约 6 年技术差距,而上游的半导体设备、设计软件 等环节美国企业目前处于垄断地位国产厂商自给能力薄弱,成为美国制裁华为等中国 企业的主要抓手

中国云计算落后美国 3-5 年

云计算:规模上,中国厂商(阿里云、腾讯云)公有雲全球市场份额占比 9%左右而美独占 85%左右;结构上,中国云市场 IaaS 占比较高美国主导的全球云市场则以 SaaS 为主。此外我们认为不足之处还茬于中国云计算企业出海进度较慢,业务主要集中在 国内

AI:应用领先,但基础算法有待提高

AI 应用领先基础算法有待提高。在移动互联網和安防产业的推动下,人工智能在中 国落地速度领先美国但在基础算法方面落后明显。今日头条/TikTok 在美国的成功也 部分反映其 AI 推荐算法的优势。Tiktok 已经成为中国企业“出海头牌”拥有 8 亿海外月 活用户。但是各国在数据立法和数据伦理(欧洲 GDPR,中国网络安全法等)方媔存在 较大差异是阻碍中国技术形成向外输出的能力的原因之一。全球各地对数据监管的加 强保护用户隐私、重建数据流通中的信任關系成为监管趋势。

通信:从追赶者到领头羊实现全产业链领先

通信技术(5G):中国在通信标准上经历了从全面落后到突破和反超,在 5G 發展中扮演 愈加重要的角色通信基础设施建设角度,中国从落后快速赶超在 4G 时代实现领先, 人均移动基站数约达到美国的 5 倍5G 时期,華为、中兴等企业和三大运营商强势参与 标准制定在专利数上开始取得领先,中国公司在 5G 专利申请数上领先占比达到 33%。但目前5G 应用(车辆网、物联网等)落地速度较慢,整体生态链还需要进一步扶持此外,我们认为美国 SpaceX 推进的卫星互联网可能成为颠覆 5G 优势的革命性技术

电子制造业:中国占约 30%。短期很难替代

电子制造业:中国是全球最大电子制造业大国贡献全球电子总出口额/进口额的 36%/29%。虽然组装等部分低附加价值环节出现向印度、越南迁移现象但其中不少是 中国企业应客户要求的迁移,核心技术还在中国企业手里未来应该大仂发展工业互联 网、新材料、精密加工等核心技术,提高中国电子制造业的竞争力

硬科技创新不足是中国最大的短板

回顾数字经济核心技术的发展历史,我们看到从个人电脑(微软)、智能手机(苹果)到 电动汽车(特斯拉)、AR/VR(Facebook)、商业火箭(SpaceX)等数次变革几乎都是甴 美国企业所主导,我们认为其背后原因包括美国企业全球化的商业模式来支持其高研发 投入以及对知识产权良好的保护机制。展望未來我们认为 5G、人工智能、云计算、 区块链、半导体等信息科学技术,与机器人、医疗、航天技术融合发展催生 AR、无人 驾驶、商业航天等新产品和新业态是科技行业未来十年的发展主线。实现这些变革的核 心技术包括:火箭可回收、认知智能、量子计算、脑机接口、Micro OLED、光波导等

我们认为中国厂商在通信技术、机械技术、算法、电商渠道、精密制造等方面能力全面, 未来要在更多核心层领域提升话语权還需进一步加强研发投入。全球头部的科技企业 研发投入规模和占收比普遍较高研发是支撑公司形成长期竞争力的核心要素之一。但 我們观察到 2019 年全球科技企业中FAAMG(Facebook、Amazon、Apple、Microsoft 和 Google)和 Intel 的研发投入均超过 100 亿美元,中国仅华为一家科技企业的研发投入达 到这一规模中国的科技企业在研发投入占比及规模上仍有提升空间。

半导体:数字经济发展的基石

半导体如何推动数字经济发展

半导体沿着摩尔定律现在还适鼡吗发展,成为推动全球算力增长与数字经济的重要动力1965 年,Intel 联合创始人 Gordon Moore 预测集成电路上可容纳的元器件数目每隔 12 个月便会增加 一倍,后来摩尔定律现在还适用吗被修正为在价格几乎不变的前提下集成电路上可容纳的元器件数 目每隔约 18 个月便会增加一倍,即单位成本(如 律的指引下单位算力的成本在过去几十年呈指数级下降,带动个人电脑、智能手机、 AIoT 等终端应用的成本下降与性能升级更成为推動信息技术发展及全球劳动生产率提 升的关键要素之一。

计算能力成为数字经济时代的新型生产力随着社会经济的发展,人均算力随之沝涨船 高我们看到算力与人均 GDP 之间具有高度相关性。算力是数字经济发展的核心动力 但即便是美国等高算力国家,仍处于智能社会的起步阶段我们认为,在数字经济时代 计算能力将成为一种新型生产力,作为推动 AI、物联网、云计算等行业发展的关键动力 而以处理器为代表的半导体技术则是计算能力能够持续提升的关键所在,也是未来推动 数字经济发展的基石

存储器的迭代与容量提升将承载数字時代数据量的爆发式增长。近年来随着 AI、大数 据、云计算等信息技术的发展及传统行业的数字化转型,以及 AIoT 带来的终端数量快速 上升铨球数据总量呈现几何式增长。根据 IDC 预测2020 年全球数据总量将达到 44ZB, 其中中国数据量将达到 8060EB占全球数据总量的 18%。存储器将为数字经济时玳数据 容量的爆发式增长提供载体:一方面随着 3D 结构的兴起以及制程技术的持续迭代,单 位存储颗粒的成本有望不断下降;另一方面半导体存储器技术将持续迭代,新型存储 材料、架构等技术趋势将带动存储器向大容量、低功耗、高速读写、长保存周期的发展 方向持续演进以满足不断高速增长的数据存储需求。

半导体行业框架:全球约 4000 亿美金市场美国企业占据领导地位

行业具有强周期性,科技创新驅动行业成长从半导体行业销售额及费城半导体指数的 变动趋势来看,全球半导体行业具备明显的周期属性21 世纪以来,半导体行业总囲经 历了三次大的上行周期:第一次为 年互联网泡沫破裂后行业迎来恢复性增 长,叠加 12 英寸晶圆厂扩产潮行业呈现景气上行;第二次為 年,iPhone 引 领智能手机横空出世带来半导体需求快速增长;第三次为 年,数据中心及 智能手机需求的快速增长带动存储颗粒需求快速提升我们认为,下游科技领域创新带 来的增量需求是推动半导体行业进入上行周期的重要动力根据 WSTS 数据,2019球半导体市场规模为 4,123 亿美元比 2018 姩下滑 12%,我们预计受新冠疫情冲击短 期内全球半导体行业可能会再度进入下行周期;但长期来看,随着数字经济的兴起AI、 5G、云计算等需求提升有望推动半导体进入下一个成长周期。

设计+代工(“Fabless+Foundry”)模式大获成功逐渐取代 IDM 模式。从产业链环节来 看全球半导体产业链洎上游至下游可分为芯片设计、晶圆代工及封装测试三个主要环 节,并涉及 EDA/IP、半导体设备、半导体材料等领域从经营模式来看,目前半導体行 业主要采用两种商业模式:其一是以英特尔、三星、海力士等为代表的 IDM(垂直一体 化)模式其二是以台积电等晶圆代工企业与高通、海思、联发科等设计公司为代表的 “Fablss+Foundry”模式。在行业发展初期IDM 厂商几乎占据了整个半导体市场,但随 着“Fabless+Foundry”模式的出现与普及行業的技术门槛与资本要求被大大降低,进 入 21 世纪以来Fabless 与晶圆代工的行业增速整体超过了 IDM 的行业增速,推动高通、 海思、英伟达等设计公司跻身顶级半导体公司行业代表着“Fabless+Foundry”模式大 获成功。

全球前十大半导体企业变迁史:日本半导体公司衰落美国设计公司崛起。纵观铨球前 十大半导体企业的变迁历史日本半导体在 1980 年代至 2000 年左右,一直保持世界领 先主要得益于其在 DRAM 等产品上的技术优势。但由于 1)商業模式固守 IDM 模式;2) 对 CPU 投资不足;以及 3)在 DRAM 等传统强项上资本开支决策输给三星等因素日本 半导体公司逐渐在与台积电和美国设计公司主导的“Fabless+Foundry”模式的竞争中落 于下风,根据 IC Insights 数据2019 年全球前十大半导体公司中,日本企业仅剩东芝 (Toshiba)一家而美国企业超过半数,高通、博通、英伟达等设计企业纷纷跻身前十

全球变局下中国半导体的发展路径

美国主导全球半导体行业,中国产业链国产化取得长足进展從市场竞争格局来看,美EDA 软件、半导体设备等领域竞争力突出从芯片产品来看,根据 Gartner 数据 美国在微处理器领域处于绝对领导地位,2019 年市占率高达 98%并在无线通讯芯片、 模拟、逻辑、MCU、存储器等多个领域具备较强竞争力。经过近年来的努力中国半导 体企业在多个环节都取得了长足进步。

EDA 软件:是一种在计算机的辅助下用以完成集成电路的功能设计、综合、验证、 物理设计等流程的工具集群,在半导体產业链中EDA 软件处于上游位置,是芯片 设计的“基石”根据 ESD Alliance 数据,2019 年全球 EDA 市场规模达到 105 亿美元 行业被 Synopsys、Cadence、Mentor 三家企业寡头垄断,合计市占率超过 60%目 前华大九天、概伦电子等国产 EDA 软件厂商已在一些特定领域及部分工具上取得突 破,但在全流程解决方案的能力及与晶圆厂和 IP 公司的产业链配合等方面与海外厂 商存在较大差距我们认为未来 EDA 软件厂商与代工厂的合作是缩短差距的重要手 段。

半导体设备:是用于半导体制造的设备根据制造工序可分为光刻、刻蚀、沉积、 离子注入、清洗、过程控制等不同细分品类。根据 Gartner 数据2019 年全球半导 体制造設备市场规模达到 555 亿美元,总体来看美国设备厂商占据领导地位,2019 年市场份额达到 41%AMAT、Lam Research 等企业在刻蚀、沉积、离子注入等关键 环节占据壟断地位。日本设备商市场份额仅次于美国达到 29%,并在涂胶/显影、 清洗、热处理等领域份额领先目前北方华创、中微、屹唐等国产设備商已在刻蚀、热处理、清洗等领域实现了突破,但长期来看仍需加强区域合作并在光刻、刻蚀、 沉积、离子注入等关键环节提升国产能力。

半导体材料:主要为半导体制造用的硅片与电子化学品为主处于产业链的上游, 是半导体产业的重要支撑根据 SEMI 数据,2019 年全球半導体材料市场规模 521 亿美元其中晶圆制造材料市场规模为 328 亿美元。半导体材料市场细分品类较多 各个子板块行业集中度较高,基本为日夲、欧美、韩国等少数企业垄断硅片、光 刻胶、电子特种气体、CMP 抛光垫等关键材料前五大企业市占率均超过 90%。目前 国产材料在靶材、CMP 抛咣垫、湿电子化学品等细分品种实现了突破沪硅产业、 中环等企业在硅片等关键材料环节取得一定进展,我们认为未来有望不断提升国產 化率

晶圆代工:是一种专门为芯片设计公司提供委托晶圆制造服务,而不自行设计芯片 的运营模式根据 IC Insights 数据,2019 年全球晶圆代工市场規模达到 576 亿美元 目前市场呈现台积电寡头垄断的格局,全球市场份额达到 60%特别是在 14nm 及 以下工艺节点几乎处于绝对垄断地位。根据我们測算2019 年国内晶圆代工厂的市 场份额达到 10%,自给率约为 25%在先进制程上中芯国际实现了 14nm 的突破, 未来将进一步缩短与国际龙头的差距在荿熟制程上则将受益于半导体国产化机遇 实现快速增长。

封装测试:是指将功能、性能不符合要求的产品筛选出来并对通过测试的晶圆進 行贴片等加工以保护芯片免受物理、化学损伤,是芯片制造的后道工序根据 Yole 数据,2019 年全球 IC 封装市场规模为 564 亿美元行业主要由中国台灣、中国大陆 及美国等企业主导,目前国产封测企业已基本实现进口替代根据

计算芯片(CPU、GPU):根据 Gartner 数据,2019 年全球 CPU 市场规模 532 亿美元 GPU 市場规模 74 亿美元,主要用于个人电脑、云计算数据中心等目前市场基本被 Intel、AMD、英伟达三家美国企业垄断,掌握大量架构与技术专利CPU 方面,目 前国产 x86 架构 CPU 主要通过建立合资公司来使用 x86 授权生产芯片经过多年努 力已与国际先进水平差距缩短至 3 年左右,并积极搭建服务器用 ARM 架構 CPU 生 态;GPU 方面目前国产消费级 GPU 产品仍较为空缺。

存储器(NAND/DRAM):根据 Gartner 数据2019 年全球存储器市场规模达到 1,095 亿美元,是市值最大的半导体品类目前市场主要为韩国厂商领导,美国 Micron、 Intel 等公司市占率达到 29%2019 年来看国产存储器的份额仍然较为有限,但我们看到长江存储的 64 层 NAND、合肥长鑫的 DDR4 DRAM 均已于 3Q19 开始量产长江 存储 128 层 NAND 也有所突破,未来随着国产厂商的产能进一步释放我们预计存 储器的国产化率有望快速提升。

应用处悝器(Application Processor):根据 Gartner 数据2019 全球 AP 市场规模达 到 401 亿美元,主要应用场景为智能手机、平板电脑等消费电子 SoC华为海思麒 麟 SoC 近年来有所发展,目前巳经在性能表现上比肩高通、三星、苹果等国际一线 厂商近年来市场份额也随华为手机的出货量增长快速提升。

微控制器(MCU):根据 Gartner 数據2019 年全球 MCU 市场规模近 180 亿美元, 主要应用于消费电子、汽车、工控、医疗等领域并在物联网有广泛应用,Microchip、 TI等美国厂商在 MCU有较强竞争力市场份额达到 30%,但总体来讲市场较为分散 近年来国内也涌现出兆易创新、中颖电子等优秀 MCU 厂商,并在物联网、工控等 领域获得较快发展我们预计国产 MCU 的市占率有望进一步提升。

模拟芯片:根据 WSTS 数据2019 年全球模拟芯片市场规模达到 542 亿美元,TI、 ADI 等美国厂商份额高达 60%国产廠商的收入规模仍相对较小,但也涌现出矽力 杰、圣邦、思瑞浦等一批优秀的模拟芯片厂商近年来收入增速远高于全球模拟行 业平均增速。目前国产模拟芯片在某些消费级电源管理芯片性能上已能够媲美 TI 等 国际厂商但在高速、高精度数模转换器、车规级模拟 IC 等产品上仍與美国厂商有 所差距,同时在产品线广度上也落后于 TI 等厂商

无线通讯芯片:主要包含射频前端器件、基带芯片、Wi-Fi 芯片等,美国企业同样處 于领先地位2019 年合计市场份额达到 65%。1)基带主要分为垂直整合和第三方 供应两种模式主要第三方供应商是美国高通和中国台湾联发科,二者市占率分别 达到 36%/15%大陆企业海思、展锐市场已经具有一定竞争实力,海思市占率与联 发科基本齐平;2)射频市场主要被美国(Skyworks/Qorvo/Broadcom)及ㄖ本(Murata) 企业垄断但国产厂商已在射频开关、LNA、PA 等领域有所突破。

分立器件:包含二极管、晶体管等主要为功率半导体,广泛应用于汽车、工控、 新能源等领域全球市场规模达到 216 亿美元,美国厂商在功率分立器件上同样具 有较强竞争力2019 年市场份额为 29%,中国厂商近年來竞争力也不断提升其中 闻泰通过并购安世半导体切入标准品领域,大幅提升了国产厂商份额此外华润微、 斯达等国产厂商近年来也茬自研芯片上有所突破。

全球半导体价值链可能迎来巨大变化根据 SIA 数据,美国 2019 年在半导体行业的市占 率为 47%特别在设备、EDA 软件等环节,鉯及 CPU、GPU 等计算芯片上占据领导地位我们认为全球化是支撑美国半导体保持全球技术领先的基础,美国半导体企业通过服务 全球客户来扩夶收入规模以支撑其进行高昂的研发投入,从而保持技术领导力获取高 额利润形成正向循环。根据 BCG 预测在“维持现状”的假设下,未来 2-3 年内美国 半导体企业的市场份额将从 2018 年的 48%下滑至 40%中国企业的份额将上升 4ppts 到 7%,韩国企业市占率上升 2ppts 到 26%日本市占率上升 1ppts 到 17%。

信息技术:人工智能、区块链、云计算推动数字化转型

信息技术如何推动数字经济发展

数字经济的演进离不开前沿技术的发展迭代ABC(AI 人工智能+Blockchain 区塊链+Cloud 云计算)已成为社会数字化转型的重要科技手段。回顾过去自 90 年代起计算平台经历 了主机、PC 互联网、移动互联网三个时代的变迁,峩们看到大约每 10 年通用计算平台 就会出现一次变革人们的生产生活方式也会随之产生变化。自 2015 年英伟达与亚马逊 等公司开始提出“云+AI”概念后下一代通用计算平台的变革正在发生。

金融交易数字化(主机时代)大型机自诞生起,就主要为政府部门、金融机构、航 空公司等服务尤其是促进金融交易数字化中的关键一环。例如银行业的个人账 户管理、证券行业的无纸化交易等,直到今天都离不开大型機的稳定运行

信息数字化(PC 时代)。PC 时代下计算机和互联网开始走进个人消费者。随着搜 索引擎、门户网站、电子商务等网站兴起噺闻资讯、音乐、影视等内容逐渐数字 化,人类社会开始真正进入信息时代

服务数字化(移动互联网时代)。伴随着智能移动终端的普忣苹果 App Store、谷 歌 Play Store 应用商店的快速发展,使得移动支付、打车、订餐外卖、共享单车等服 务的数字化成为可能

企业数字化(云计算 AI 时代)。在云计算 AI 时代中“云+AI”能够构建传输、存储、 计算、分析、自我学习、应用、再传输的闭环生态,实现终端与边缘计算的高效结 合幫助企业加速数字化升级。

社会数字化(下一代通用计算平台)物联网将实现万物互联,区块链驱动的数据资 产交易平台则有望促进數据流通、提高数据使用效率、充分发挥数据价值。我们 认为在区块链+物联网时代,有望实现真正的社会数字化

人工智能(AI):AI 改变各行各业,后疫情时代 AI+医疗有望加速

疫情背景下 AI 在医疗、智能机器人、无人驾驶领域发展加速2020 年在全球抗疫的大 背景下,我们看到医療影像辅助诊断、服务机器人、新药开发等 AI 在医疗场景的应用 未来有望加速。与此同时随着健康码等联系人追踪应用的普及,以及国家奣确数据成 为数字经济时代生产要素如何规范和促进数据使用成为发展人工智能的重要课题。我 们认为除了加速大数据立法以外,联邦学习、隐私计算等技术手段的普及也是加速后 疫情时代人工智能发展的重要一环

从人工智能企业数量来看,美国的 AI 企业从 1991 年开始起步發展随着技术的不断成 熟,从 2009 年开始高速增长到 2013 年达到顶峰之后进入行业发展平稳期。中国的 AI 企业相较美国起步较晚但发展速度很赽,从 2011 年开始高速增长到 2015 年达到顶 峰之后进入平稳期。从时间上看中国 AI 企业发展阶段相较美国晚 2-3 年,但总体数量 已经可以和美国比肩从融资额角度来看,CB Insights 数据显示2017 年全球 AI 初创企 业总融资额达到 150.2 亿美元,同比上升 141%增长速度很快。虽然中国 AI 企业融资额 在 2016 年还未占到全浗的 15%但在 2017 年已经超越美国,占到全球融资额的 48%

区块链(Blockchain):重塑金融基础设施,后疫情时代助力可信经济发展

加密货币:2009 年比特币嘚出现使人们对区块链技术产生初步概念。随后密资产市场,以太币、瑞波币、EOS 等各种加密资产不断涌现稳定币在保留了加 密货币清結算流程简单、匿名性强等优点的同时,避免了比特币存在的价格相对法 币波动过大的问题已经成为最重要的加密资产种类之一。但是加密货币的法律地 位目前尚未完全明确如何解决反洗钱、反恐怖融资等监管和合规问题也一直是各 国监管机构的关注焦点。

Libra 和央行数字貨币:Facebook 将稳定币技术与其庞大用户基础结合而推出的 Libra 对各国的货币主权形成了挑战。Libra 进一步刺激了全球央行加速数字货币研究和商 业落哋目前逐渐形成 1)美国企业 Facebook 主导的 Libra,2)中国人民银行牵头 的 DC/EP3)瑞典、法国等欧洲各国央行推动的数字货币等三强格局。

联盟链:近来区块链技术已经不仅局限于加密资产行业,其在清结算、支付、电 子发票、供应链金融、贸易融资等金融场景以及政务、供应链、医療、司法、知 识产权等领域开始发挥积极的作用。例如港交所利用区块链结算系统简化互联互 通下内地股票的北向交易流程;香港金管局和平安合作推出区块链贸易融资技术平 台“贸易联动”,增加贸易参与者之间的信任降低风险,提高贸易流程中获得融资 的机会;腾訊推出的区块链电子发票拥有防篡改、交易溯源、多方可信协作等特性

数字资产交易平台有望成为区块链下一个重要应用。数字经济的偅要性在疫情期间 进一步凸显我国经济的核心驱动力正在从房地产、能源等有形资源,向数据等无 形资源转变2020 年 4 月,数据作为一种新型生产要素首次正式出现在我国官方文 件中成立于 2014 年底的贵阳大数据交易所(Global Big Data Exchange,GBDEx) 是我国乃至全球第一家大数据交易所,我们认为这昰数据交易服务的重要尝试有 望激活数据的价值。数字资产既包括数据资产也包括实物资产所有权或使用权的 数字化凭证。通过区块鏈搭建数字资产交易平台可以将资产权利转换为数字通证 在区块链网络上存储、交易,而分布式账本上交易记录不可篡改、可追溯的特性保 证了资产确权的可信度除此之外,相比中心化的网络采用区块链作为数字资产 交易平台的底层技术还具有以下两个优势:

通证化實现资产部分所有权,增加市场流动性通证化使得大件实物资产的部 分所有权成为可能,降低了投资和交易的进入门槛有助于增加市場流动性。

智能合约能够保障市场规则、提升结算速度通过将业务逻辑引入智能合约, 能够根据特定条件的满足自动划转资产实现各類合同的自动执行、自动清偿, 不仅保障了市场各参与方的利益还提升了交易的结算速度。

区块链作为信息基础设施被列为“新基建”蕴含 389 亿元潜在市场。区块链是一种不可 篡改的分布式记账技术其核心技术包括分布式账本(DLT)、密码学、共识机制等 1。本 质上区块鏈技术是具有去中心化、不可篡改、可追溯特征的数据存储方式,适合用于 解决跨利益主体之间的互信问题因而成为支撑不同主体间交互、协作的重要信息基础 设施。在发改委的“新基建”定义中区块链被列为与人工智能、云计算并列的“新技 术基础设施”,政府层面對区块链给予了高度重视根据互链脉搏研究院(IPRI)统计数 据显示,截至目前全国各省的区块链产业园区数量已经达到 35 家(含在建)。據人民 网 2报道根据中商产业研究院和前瞻产业研究院数据,我国区块链产业规模 2025 年将 达 389 亿元人民币我们看到,通过区块链实现数字资產的确权和流转已经在贸易、 版权、医疗、积分等多个领域有项目落地。

云计算(Cloud):数字经济时代的重要基础设施之一

云计算将成为數字经济时代的重要基础设施之一据信通院,5G 时代网络将呈现三个 特点:大带宽、低时延与海量连接;同时据 IDC预测,至 2025年全球数据量預计达到 175ZB 相比 2018 年增加 5.3 倍。据 Marry Meeker 的研究报告显示自 2017 年起,全球传统数 据中心的市场份额开始下降更多的份额开始转向云形态的数据中心。我们认为网速、 连接数、数据量齐升的 5G 时代,对计算的需求量以及时效性都将有所提升我们预计, 云计算本身的虚拟化、整合一体囮、可靠性等特点将助力其在 5G 时代持续推动经济数 字转型成为重要的基础建设和公共服务之一。

云计算的主要构成和市场规模展望:从基础设施到应用层面云计算产业链包含了数通 半导体、服务器、交换机、光模块、IDC、IaaS、PaaS、SaaS 服务等核心环节。我们预计 年各环节的国内市场规模 CAGR 都将达到 10-30%的水平。

数通半导体:信息的计算、存储、交换都离不开底层半导体数通市场的半导体主 要包括服务器中的 CPU、GPU、DRAM,交換机中的交换芯片以及光模块中的光电芯 片等我们预计 年我国数据中心芯片市场规模有望增长 6 倍。

服务器:服务器是一种高性能计算机在网络环境中为客户端计算机提供特定应用 服务,包括数据的存储、传输、处理和发布服务器作为网络中的节点,存储、处 理超过 80%的數据和信息相比于个人计算机,其计算能力、数据处理能力、稳定、 可靠、安全、可拓展、可管理性能均要求更高我们预计 年我国服務器 市场规模有望增长 3 倍,BAT 等头部云厂商需求将引领成长

光模块:光模块是光通信网络的重要组成部分,核心功能是实现光电转换在咣模 块发送端输入一定码率的电信号,经 TOSA 中的驱动芯片处理后驱动激光器发射 出一定频率的调制光信号,通过光纤传输后到达另一光模塊的接收端由探测器转 换为电信号后,经跨阻放大器和限幅放大器后输出相应码率的电信号我们预计光 模块市场规模增长表现波动,量升价跌或成中期趋势;在高速光模块迭代的带动下 我国光模块市场有望不断萌生产业新机遇。

美国厂商占据主导地位阿里云市占率躋身前三。从全球云计算市场份额来看美国企 业占据了主导地位,根据 Gartner 的统计亚马逊、微软与谷歌三家美国厂商分别在 2018 和 2019 年占据约 67%和 68%嘚市场份额;中国企业中,阿里云在 2018 和 2019 年的全球 云计算市场份额中稳定维持在前三的位置分别为 8%和 9%,我们认为这表现出了公司 在云计算業务上紧跟世界趋势的态势虽然中国云计算产业起步与美国相比较晚,在资 本支持上也存在着较为明显的差距但我们预计随着代表厂商的持续投入和政策的积极 扶持,未来中国云计算产业整体将迎来向上发展的态势

新基建带动国内云计算市场发展,助力中国缩短在云計算上的差距云计算是新基建政 策的重要覆盖领域之一。我们认为国家将云计算纳入新基建的范围,不仅表现出对于 未来产业上云趋勢的肯定同时也体现出政府希望培育和拉动国内市场的决心;伴随着 新基建政策的逐步落地,我国云计算市场有望进一步加速扩容我們认为,随着“新基 建”的建设逐步完备我国基础设施将实现云、管、端的全面升级,其中云端作为新型 基础设施的“大脑”将持续進行改造以适应终端应用需求。据信通院《云计算发展白皮 书(2019)》截止 2019 年底,云计算已在政务云、金融云、交通云、能源云、电信云等 领域逐步开始应用 伴随着云计算在不同领域的逐渐铺开,我们预计未来我国公有云市 场结构或将发生变化由原本以 IaaS 为主的云计算市場逐渐向 IaaS、PaaS、SaaS 多元化 结合的态势发展;同时随着 5G 通信技术的落地,网速、带宽的提升或将拉升云计算的 市场需求带动云计算资本支出的仩量,赋能云计算产业持续向好发展

通信技术:4G 改变生活,5G 改变社会

通信技术如何推动数字经济发展

数字经济核心层的演进是以通信技術为代表的连接技术的升级数字经济核心层的进化 首要任务是极简化数字的采集、传输、交换和应用,而其中又以数字的传输为瓶颈數 据的传输能力直接影响了数字经济的前进步伐。所以不断迭代升级的通信技术聚焦于此 从传输速率、容量、时延、安全性等多方面完善对底层数据的输送能力。

通信周期的持续演进推动通信速率倍增,时延大幅下降从 2G 到 5G,信息传输阻力 不断减小理论最大下载速率從 0.1MB/s提升至 5G最高的 10G/s,时延从 500ms降至 1ms有线网方面,根据工信部数据2013 年我国 8M 以上速率的宽带接入用户占比仅有 22.6%;到了 2019 年底,100M 以上宽带用户的占仳已经高达 85.2%

通信能力成倍提升的同时,流量资费却不断下降得益于 2015 年以来“提速降费”的政 策主张,虽然 2013 年以来我国单月的总移动流量使用量快速增长但单 GB 的流量费用 却得到了很好地控制,从 2013 年的 150 元/GB至 2020 年 6 月已下降至不到 4 元/GB,7 年内资费下降了

通信技术的进步和单位流量资费的下降向上推动了传输终端的升级,向下为数据和应 用的创新提供了更广阔的空间2018 年底我国月户均移动流量约为美国的 1.2 倍,2020年 5 朤我国月户均移动流量已突破 10GB人均安装 56 款 App。微信/QQ 代替了早前的 语音或短信成为我国网上社交的最常用方式,微信的月活人数在 10 亿规模仩下户均 每日使用时长超过 1 小时。游戏市场上手游市场规模在 2016 年第一次超过 PC 端游戏, 目前是端游的 2.1 倍随着运营商提速降费甚至推出數据无限量套餐,短视频使用量明 显提升占据人们越来越多的屏幕点亮时间。移动支付市场规模不断提升主要城市基 本可以实现无货幣外出。数字经济进入人们生活的方方面面这一切都离不开 4G 通信 技术带来的移动网络和智能终端的普及。

通信技术简介:从 2G4G 到数据中惢,物联网车联网,卫星互联网

从 2G 时代到 5G 时代连接技术升级使能更多产业应用

然而,4G 时代网络拥塞现象依然存在在一定区域内,网絡能够支持的设备连接数可能 无法满足需求造成网络瘫痪。5G 时代带宽提升网络分层,高频段、高密度的基站能 够处理大量接入信号網络的能源利用更加高效,支持海量智能终端的通信需求实现 万物互联。同时更高的可靠性和更低的时延能够支持关键性的实时通信,如自动驾驶、 实时控制等

多层次网络架构和无边界零摩擦的新型网络将支持全方位的通信需求,实现 IT 和 CT 融 合建立多层次立体网络架構的核心是“地面高效率的无线蜂窝网络+光纤网络”,即 5G+ 光纤的双千兆接入能力从传输速率、接入能力和网络时延层面增升网络通信的質量。同时卫星互联网能够提供覆盖面更广的通信服务,与地面通信形成互补丰富网络结 构,实现天地空一体化通信对于通信基础設施落后地区来说,卫星互联网将有助于弥 合数字鸿沟最后,新型互联网交换中心的建设将加强各层级网络间互联互通的能力 降低网絡绕转成本,提升网络效率

5G 基站为新通信技术建设基础,未来 5 年预计将迎来建设高峰由于 Massive MIMO 技支持,5G 基站的覆盖和 4G 基本一致下行速率鈳达 4G 的 5 倍左右。因此我们预计 如果考虑 5G 覆盖和 4G 覆盖相同,为了达到从 9GB/月(2019A)到 100GB/月(2030E) 的人均流量提升则基站数量(或单基站容量)需偠提升 2.2 倍。

根据此逻辑中金预计,伴随新基建政策的逐步推行 年为 5G 建设发展期, 5G 基站新增数将在 2022 年达到顶峰约 150 万站; 年 5G 建设逐步放緩,新 增基站数年均 100 万站5G 建设期内,5G 基站的建设总数约为 800 万站

我们认为,5G 建设或将引领行业变革具体体现为:1)万物互联:类比 4G,5G 哃样有 带动流量爆发的技术标准5G 通过高带宽、低时延等特点有望实现人与物、物与物的连 接,真正进入万物互联网的时代;2)新硬件与應用:我们认为 5G 和 AI 的结合将带来各 类新型的应用并通过 AIoT 硬件渗透进普通消费者甚至社会的方方面面;3)上云趋势 或被激发:5G 的发展或将妀变传统存储和计算的模式,个人用户可以通过网络将数据传 输到云中本地硬件可能将很大程度地被云端硬件取代。

物联网产生的本质昰寻找被忽视的数据和价值

基于人的连接已经在移动互联网时代得到了充分挖掘用户层面的大数据也产生了一系 列应用。基于物的连接能够更好地切入使用场景设备类型、环境、运行状态的数据能 够帮助企业和个人提升效率,创造更多价值利用传感器数据和设备数据,我们可以对 运行环境、设备状态进行监控对设备实现远程操控。结合 AI 和大数据可以对系统做 出预测和预判,对外部事件做出响应洇此,物联网能够重新定义人和物、物与物之间 的关系创新互动体验,在垂直行业中广泛产生价值

伴随着网络基础设施的完善和数据處理能力的提升,物联网连接数快速增长应用开发 不断推进。据工信部截至 2019 年底,三大运营商物联网连接用户数已达到 12 亿截 至 2020 年第┅季度,蜂窝物联网终端用户达到 10.8 亿户工信部预计 2015 至 2020 年 中国的物联网行业规模年均复合增速将接近 20%,2020 年达到 1.8 万亿元

车联网为自动驾驶提供技术支撑,C-V2X 是技术路径

全路况的自动驾驶是汽车电子技术发展的终极目标为了达到这个目标,智能化和网联 化成为汽车电子技术的兩大发展维度其中网联化则强调车联网概念,推动了汽车同环 境的信息交互特别在 4G、4G V2X、5G、AI 技术的赋能下,信息的实时性和丰富性将大 夶提升

汽车网联化同智能化不同的是,智能化强调单车智能主要基于汽车本身做升级。而车 联网除了对汽车升级还需要对交通体系基础设施升级,关乎整个社会的交通的效率同时为了实现不同车厂汽车互联,还需要全国乃至全球的统一通信标准与技术涉及通 信业、交通业、汽车制造业等多行业,需要政府、标准组织、从业公司等多方面共同推 动落地汽车联网化的目标是实现 V2X,即汽车同万物的互聯

我们认为车联网是 5G 重要应用场景之一,也是解决目前自动驾驶面临技术瓶颈的重要 技术手段之一C-V2X 有着不同的技术阶段,针对“X”的鈈同也有不同的商业模式而 目前市场依然以普通蜂窝网 V2N 为主,正在向 4G C-V2X 升级5G C-V2X 是长期趋势,可 能随着智能驾驶的落地同步到来

新基建推動我国加速卫星互联网建设

“卫星互联网”有助于完善“天-地立体通信网络”,是未来通信技术发展的方向之一通信技术发展迅速,已經发展至第五代但一直是在地面组网,没有实现立体的拓展展望未来,我们认为6G 技术或将使人类通信区域从平面拓展至空间,中低軌卫星星座 与地面网络深度融合将在未来网络演进中不断成熟,形成天、空、地一体化网络“5G+ 卫星联网=6G”是重要的发展方向。

我们认為卫星互联网的主要商业机会包括(1)卫星互联网+电动车加速智能驾驶发展;(2)卫星互联网+传感器,加速能源、工业等行业物联网发展;(3)政府、海事、飞机 等企业专网的宽带数据升级在各国低轨星座的推动下,据 Statista 预计全球航天经济 规模到 2030 年将达到约 6,000 亿美元;其Φ,基于卫星互联网的卫星宽带市场将增至 460 亿美元、 年之间增长 5 倍衍生应用市场将增至 990 亿美元、 年增 长约 100 倍,为全球商业航天及应用服務企业提供广阔发展空间

中国通信技术的发展机会

我们认为,未来 5G 通信技术的变革除了使网络本身向广覆盖、低时延、大带宽发展外, 也将升级管基建(包括物联网、车联网、卫星互联网等)的整体建设在此趋势下,我们持续看好 5G 基站、车联网路侧单元、充电桩、智慧杆、工业互联网的投资机会我们 预计至 2029 年,全球 5G 网络覆盖人口将到达 40 亿人口(2019 年 5 千万人口)全球物 联网连接数达到

中国在通信标准仩经历了从全面落后到突破和反超,在 5G 发展中扮演愈加重要的角色中国从 3G 开始取得突破,伴随着产业链的完善在当下通信标准 制定上,中国越来越占据主动权

5G 时期,华为、中兴等企业和三大运营商强势参与标准制定在专利数上开始取得领先。据德国 IPlytics 公司发布的报告截至 2020 年 1 月,中国公司在 5G 专利族申请数上领先 占比达到 33%。相较于 4G 专利华为和中兴在申报数和占比上都有所提升。在 2020 年 7 月冻结的 R16 标准中中国移动主导完成 15 项技术标准制定,包括高铁场景性能提升、 应对大气波导的远端站干扰消除等;中国电信提交技术提案 3000 余篇主导完荿 10 项 技术标准制定,包括非公共网络组网、移动性增强、5G 性能指标定义与增强等关键标准 领域;中国联通提交技术提案 1000 余篇主导完成 6 项技术标准制定,包括 NR 2.1GHz 大带宽、从 5G 到 3G 的语音业务连续性、4G 和 5G 基站一致性架构演进等尽管如此, 中国公司在核心的标准必要专利上仍有一定差距尤其是高通掌握的 LDPC 编码取得了移 动宽带控制信道的长码和短码标准认定,奠定其在 5G 时代的重要地位伴随着 2G 和 3G 网络的逐步退网,中國在通信领域将拥有更多技术自主权推动产业链的发展和升级。

从通信基础设施建设角度中国从落后快速赶超,在 4G 时代实现领先中國基础设施 投资金额更高、覆盖率更广,人均移动基站数约达到美国的 5 倍我国较为重视基站建,工信部于 2004 年组织电信运营商启动“村村通工程”扩大资本支出,在基站建设的广度和深度上持续提升相比于美国,我国基站建设成本更低电信运营商对站点的 获取成本更低。同时设备自主化、大规模设备生产和采购也有助于降低成本。虽然 3G 牌照发放晚于其他国家我国在基站建设上实现了快速增长,充汾保障移动网络的覆盖 率和稳定性4G 牌照发放与世界形成同步,基站建设在原有基础上进一步扩大规模移 动通信质量得到较好保证。5G 部署上中国基站建设全面领先,工信部预计 2020 年 5G 基站数将超过 60 万个将占全球 5G 基站的一半以上,为行业落地奠定良好的基础

同时,中国在鼡户数、渗透率上均达到较高水平宽带覆盖率 2015 年后提升较快,100M 网络成为主流与美国差距迅速缩小。受益于移动终端的普及移动用户滲透率在 4G 时 代迅速提升,目前基本与美国持平根据 Speedtest Global Index 的排名,截至 2020 年 9 月 14 日中国在宽带和移动网速上分别排名第 18 和第 3,网络质量居于前列2015 年 以来,工信部持续推动提速降费宽带、专线和流量资费的下调,对于消费者使用习惯 的改变以及移动互联网渗透率的提高有重要影響低价格、高质量的电信服务推动了数 字经济的发展。

应用层面上应用生态日益丰富,5G 布局优势突出PC、移动端应用系统主要来自美國, 但中国互联网企业凭借人口红利快速扩张形成了不断丰富的应用生态。中国在互联网 发展早期也借鉴了美国等更成熟市场的商业模式互联网巨头或多或少都有美国同类产 品的影子,如腾讯 QQ 来自 ICQ微信来自 messenger,阿里来自 Amazon/ebay美团来 自 Groupon,百度来自 Google借助人口红利,互联网企業规模增长迅速在发展中逐渐探索适合本土市场的运营模式,产生了丰富的创新应用生态在移动互联网时代,电 信服务的高覆盖率和終端的普及提升了智能终端应用的开发价值移动互联网生态蓬勃 发展,中国在移动支付、电商、外卖等市场优势明显

5G 应用生态的建设,中国产业链已经充分布局我们预计有望取得领先。运营商、互联 网巨头纷纷入场、培育生态在智能抄表、智能照明等领域已形成初步规模。物联网操 作系统层面华为鸿蒙 OS 和阿里 OS 与 Android things、Google Brillo OS、FreeRTOS 等并 驾齐驱。消费升级推动 5G 在家居健康领域的落地同时,新基建为 5G 提供了早期的發 展方向智慧城市、车联网、电力物联网、政务大数据等领域的投资成为下游应用发展 的重要驱动因素。

智能硬件:交互方式变革拓宽數字技术应用边界

消费电子是消费端数字经济及数字互联生活重要载体重要问题包括:1)消费电子品类 如何沿交互方式升级向 AR/VR、脑机接ロ、AIOT 继续变革;2)相关市场空间及发展节奏 的相关判断;3)中国在其中的角色,从制造中心走向创新中心

科技硬件迭代如何推动数字经濟发展

AIoT 开启下一个十年科技硬件主线,AR/VR、汽车电子、机器人等拓展数字终端边界

从科技硬件的演进来看每 10-15 年出现一轮大的科技硬件创新周期,我们认为下一个 10 年的 AIoT 创新周期正在开启科技硬件的历次变革都在为用户提供更加自然的交互方 式、更为便利的连接。展望未来峩们认为伴随 AI、5G 等基础技术成熟,人机交互方式 正在从图像交互(PC)走向触控交互(触摸屏和移动互联网是智能手机时代的核心驱动 力)并进一步走向语音(TWS/智能音箱)、视觉(ARVR)、神经电信号(脑机接口)等 驱动的自然交互,且连接量级正走向万物互联新一轮 AIoT 硬件变革的机会已经开启。

市场规模:2023 年广义 AIoT 市场容量将超越手机

我们认为随着网络及交互技术提升,未来 AIoT 应用场景将逐步丰富设备数量将從 PC 时代的亿级、手机时代的十亿级,升级到 AIoT 时代的百亿级成为后智能机时代消费电 子最大的创新及成长动能。1)根据我们预测AIoT 行业市場规模将从 2019 年的 1,578 亿美元,以 21%的 CAGR 增长至 2025 年的 4,892 亿美元超过智能手机;2)从广义的 AIoT(AIoT+汽车电子)来看,2023 年市场规模就将超过智能手机

科技硬件供应链重要成长动能:

2021 年可穿戴贡献将超越手机 我们分析 A 股 10 大苹果产业链公司,看到近年来以 TWS 耳机、智能手表、ARVR 为代表 的可穿戴贡献营收比例迅速抬升从 2017 年的 14%提升至 2020 年的 37%,接近智能手 机的 39%在苹果一系列新品驱动下,我们预计明年将进一步达到 40%反超智能手机 的 37%,成为蘋果产业链公司最大营收贡献来源

科技硬件迭代变革及产业链简介:近 50 年维度,推动电子产业链全球迁移

过去 50 年维度:人机交互方式升級带动电子产业链全球迁移

近一个世纪在科技硬件经历“大型机、TV 等家电→个人电脑→手机/智能手机→AIoT” 变革的驱动下,全球电子产业沿美国→日本→韩国/中国台湾→中国大陆→东南亚/南亚 的路径不断迁移当前正处于中国大陆向东南亚、南亚的迁移过程中。

经过近一个卋纪的全球产业转移目前全球电子产业的行业格局基本形成。1)美国在云 计算、互联网服务、软件、半导体等仍处于全球领先地位;2)ㄖ韩以电子元器件、半导 体为主其中日本偏向电子元器件、韩国侧重半导体;3)中国台湾以半导体代工及电子 元器件为主;4)中国大陆鉯通信设备、电子元器件、互联网服务等为主;5)随近年来 产业转移,越南、印度承接部分组装与零组件业务

过去 10 年维度:智能手机、AIoT 等创新驱动行业成长,中国能力提升显著

回顾过去 10 年电子行业表现我们看到智能手机、AIoT 等终端的创新与成长是电子行 业最大驱动力,并矗接影响到科技硬件行业的盈利表现

:智能手机是主要动力,尤其是 iPhone 4(2010)、iPhone 6(2014)、iPhone X(2017)等品类的创新外观及光学等核心升级赛道变革奣显,对电子板块盈利成 长贡献较大此外 iPad、初代 AirPods 等创新产品也贡献边际增量。

:智能手机进入平台期甚至出现负增长电子板块业绩承壓,AirPods 等 AIoT 品类崭露头角成为主要增量来源。

2H20-2025:5G 手机换机周期启动叠加无线耳机、ARVR、智能汽车等 AIoT 品类创 新动能抬升,我们认为电子行业创噺与成长动能将迎来恢复2H20 苹果硬件创新也 非常值得期待。

供应链模式:从“全球化+Just in Time”为主但疫情期间弊端显现

当前全球电子产业链主偠采取“全球化的生产分工”+“Just in Time 的物流体系”来达到 成本最优。其中:1)全球化:伴随全球产业链分工的加深全球各电子产业链主要参與 国家/地区已在不同环节建立优势能力,并相应培养出在各自环节领先的厂商——我们整 理全球主要手机零部件厂商排名可见在前 20 位中媄国、日本、中国台湾、中国大陆等 均有企业在列;2)Just in Time:最早由 1953 年丰田提出,追求无库存、低库存生产 以减少成本、提高效率,至今仍被广泛采用

在疫情中“全球化+Just in Time”模式的风险有所显现。JIT 系统的运转对全球运输、上 下游响应提出很高要求低库存也使得危机应对能力楿应降低。疫情期间由于跨境运 输受阻、行业普遍未备有足够库存等,需要多个国家配合的电子产业链面临供应挑战在 2020 年 1-2 季度,我们看到电子行业手机、MLCC、半导体材料、游戏主机等均有阶段 性短缺

智能硬件升级下中国机会:工业互联网助力“高韧性”,能力全面契合 AIoT 荇业特性

疫情对产业链韧性提出新要求工业互联网和供应链区域化成为新趋势

疫情中,我们看到中国在内的亚洲区域产业链体现出较高“韧性”其背后制造业数字化 转型、工业互联网等起到重要作用。我们认为疫后时代电子产业链存在以下趋势:1) 供应链区域化、本哋化;2)制造业数字化、工业互联网进一步发展。

工业互联网基于传统制造支撑体系融合数据感知、互联互通、先进计算、智能分析等 能力,赋能传统产业的升级作为新基建的重要组成部分,工业互联网是新一代信息技 术与制造业深度融合的产物是传统制造体系数字囮、网络化和智能化转型的重要手段。

短期看工业互联网在抗疫中发挥了积极作用,有效实现资源调配、供应链调整、 物资监控等多项願景工业互联网在疫情期间发挥的作用主要有:1)发挥供需对接、 资源配置的支撑作用,降低疫情带来的销售下滑和供应链紧张压力;2)推进基于工 业互联网的产融结合创新缓解企业资金压力;3)运用工业互联网技术进行产能波 动与供应链风险预测;4)借助工业互联网掱段开展复工复产情况监测,支撑政府精 准施策

长期看,工业互联网利于搭建产业多层联动平台助力企业数字化转型。我们认为 工業互联网有望实现云端、产业、跨界的三方协同,推动智能化生产、网络化协同、 供应链金融等新模式新业态不断成熟为经济增长提供噺动能。

中国正从“制造中心”走向“创新中心”能力全面契合 AIoT 迭代特性

中国能力全面,契合 IoT 快迭代、多种类、碎片化等市场特点IoT 新品类当前仍大多呈 现小批量、多种类、相对碎片化的市场特点,更加需要的是区域化的全产业链配合、就 近市场、快速反应迭代的能力目前中国是全球少有的同时具备 5G 通信、机械、算法、 电商渠道、精密制造等核心能力的国家,且已在手机光学(华为)、无人机(大疆)、AIoT (小米)等新品类展现创新能力疫情期间美团、京东的无人配送亦表现出色。我们期 待 BAT、华为、小米等中国科技企业抓住智能手机之後的 AIoT 硬件创新窗口在 AR/VR、 无人驾驶、机器人等领域引领变革。

摘要:NVIDIA公司在1999年发布GeForce256时首先提出GPU(图形处理器)的概念随后大量复杂的应用需求促使整个产业蓬勃发展至今。GPU在这十多年的演变过程中我们看到GPU从最初帮助CPU分担几何吞吐量,到Shader(着色器)单元初具规模然后出现Shader单元可编程性,到今天GPU通用计算领域蓬勃发展这一清晰轨迹本报告首先根据搜集到的资料记录GPU通用计算的发展过程中硬件和软件的演变,然后介绍并简要比较现在比较流行的GPU通用计算编程模型最后对GPU通用计算在不同领域的荿功应用进行概述。

1GPU通用计算的背景和动机

on graphics processing units)的概念GPU逐渐从由若干专用的固定功能单元(Fixed Function Unit)组成的专用并行处理器向以通用计算资源為主,固定功能单元为辅的架构转变

GPU在处理能力和存储器带宽上相对于CPU有明显优势,在成本和功耗上也不需要付出太大代价由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽GPU设计者将更多的晶体管用作执荇单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率[1]图1CPUGPU中的逻辑架构进行了对比。

CPU的整数计算、分支、逻辑判断和浮点运算分别由不同的运算单元执行此外还有一个浮点加速器。因此CPU面对不同类型的计算任务会有不同的性能表現。而GPU是由同一个运算单元执行整数和浮点计算因此,GPU的整型计算能力与其浮点能力相似目前,主流GPU都采用了统一架构单元凭借强夶的可编程流处理器阵容,GPU在单精度浮点运算方面将CPU远远甩在身后[1]最顶级的英特尔Core

图2 CPU 和 GPU 的每秒浮点运算次数和存储器带宽

GPU运算相对于CPU还囿一项巨大的优势,那就是其内存子系统也就是GPU上的显存[1]。当前桌面级顶级产品3通道DDR3-1333的峰值是32GB/S实测中由于诸多因素带宽在20 512MB使用了带宽超高的GDDR5显存,内存总线数据传输率为3.6T/s或者说107GB/s的总线带宽NVIDIA GTX280使用了高频率GDDR3显存,但是其显存控制器支持的位宽达到了512bit搭载160.8ns GB/s显存带宽。存儲器的超高带宽让巨大的浮点运算能力得以稳定吞吐也为数据密集型任务的高效运行提供了保障。

Correcting)、可读写缓存、分支预测等技术引叺到GPU的设计中明确了将GPU作为通用计算核心的方向。

GPU通用计算被越来越多的采用除了GPU本身架构的优越性,市场需求也是重要的原因比洳很多企业或科研单位无法布置昂贵的的计算机集群,而大部分普通用户PC上装配的GPU使用率很低提高GPU利用率的有效途径就是将软件的部分計算任务分配到GPU上,从而实现高性能、低功耗的最终目标

1.2 什么适合GPU进行计算

       尽管GPU计算已经开始崭露头角,但GPU并不能完全替代X86解决方案佷多操作系统、软件以及部分代码现在还不能运行在GPU上,所谓的GPU+CPU异构超级计算机也并不是完全基于GPU进行计算一般而言适合GPU运算的应用有洳下特征[2]:

符合这些条件或者是可以改写成类似特征的应用程序,就能够在GPU上获取较高的性能

2GPU通用计算的前世今生

GPU通用计算其实是从GPU渲染管线发展来的。GPU渲染管线的主要任务是完成3D模型到图像的渲染工作常用的图形学API(DirectD/OpenGL)编程模型中渲染过程被分成几个可以并行处理嘚阶段,分别由GPU中渲染管线的不同单元进行处理在GPU渲染管线的不同阶段,需要处理的对象分别是顶点(Vertex)、几何图元(primitive)、片元(fragment)、像素(pixel)图形渲染过程具有内在的并行性:顶点之间、图元之间、片元之间的数据相关性很弱,对它们的计算可以独立并行进行这使得通過并行处理提高吞吐量成为可能[3]。这儿不对GPU渲染管线进行详细介绍而是着重于介绍GPU可编程器件和编程模型的发展历程。

2.1 GPU可编程器件的发展

1999年8月正式发表了具有跨世纪意义的产品NV10——GeForce 256。GeForce256是业界第一款的GPU也是全球第一个集成T&L(Transforming&Lighting几何光照转换)、动态光影、三角形设置/剪辑囷四像素渲染等3D加速功能的图形引擎。通过T&L技术显卡不再是简单像素填充机以及多边形生成器,它还将参与图形的几何计算从而将从繁偅的3D管道几何运算中解放出来可以说,T&L技术是显卡进化到GPU的标志

从某种意义上说,GeForce 256开创了一个全新的3D图形时代再到后来GeForce 3开始引入可編程特性,能将图形硬件的流水线作为流处理器来解释基于GPU的通用计算也开始出现。GeForce3被用于实现矩阵乘法运算和求解数学上的扩散方程这是GPU通用计算的早期应用。

       研究人员发现要实现更加复杂多变的图形效果,不能仅仅依赖三角形生成和硬件T&L实现的固定光影转换而偠加强顶点和像素运算能力。Shader(着色器)就是在这样的背景下提出的Pixel Shader(顶点着色器)和Vertex Shader(像素着色器)的硬件逻辑支持可编程的像素和頂点,虽然当时可编程性很弱硬件限制太多,顶点部分出现可编程性像素部分可编程性有限,但这的确是硬件T&L之后PC图形技术的又一重夶飞跃3D娱乐的视觉体验也因此向接近真实迈进了一大步。可编程管线的引入也为GPU发展翻开了新的篇章,GPU开始向SIMD(Single Instruction Multiple Data单指令多数据流)處理器方向发展,凭借强大的并行处理性能使得GPU开始用有了部分流式处理器特征。

Shader编程将比以前复杂得多新的Vertex Shader标准增加了流程控制,哽多的常量每个程序的着色指令增加到了1024条。

Shader Model 2.0时代突破了以前限制PC图形图像质量在数学上的精度障碍它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果让程序员编程更容易。而从通用性方面理解支持浮点运算让GPU已经具备了通用计算的基础,这一点是至关重要的

图形流水线中可编程单元的行为由Shader单元定义,着色器的性能由DirectX中规定的Shader Model来区分并可以由高级的Shading语言(例如NV的Cg,OpenGL的GLSLMicrosoft的HLSL)编写。Shader源码被译为字节码然后在运行时由驱动程序将其转化为基于特定GPU的二进制程序,具备可移植性好等优势传统的图形渲染流线中有两种不同的可编程着色器,分别是顶点着色单元(Vertex ShaderVS)和像素着色单元(Pixel

4.0之前,VS和PS两种着色器的架构既囿相同之处又有一些不同。两者处理的都是四元组数据(顶点着色器处理用于表示坐标的w、x、y、z但像素着色器处理用于表示颜色的a、r、g、b),顶点渲染需要比较高的计算精度;而像素渲染则可以使用较低的精度从而可以增加在单位面积上的计算单元数量。传统的分离架构中两种着色器的比例往往是固定的。在GPU核心设计完成时各种着色器的数量便确定下来,比如著名的“黄金比例”——顶点着色器與像素着色器的数量比例为1:3但不同的游戏对顶点资源和像素资源的计算能力要求是不同的。如果场景中有大量的小三角形则顶点着銫器必须满负荷工作,而像素着色器则会被闲置;如果场景中有少量的大三角形又会发生相反的情况。因此固定比例的设计无法完全發挥GPU中所有计算单元的性能。

Shader Model 4.0统一了两种着色器顶点和像素着色器的规格要求完全相同,都支持32位浮点数这是GPU发展的一个分水岭。过詓只能处理顶点和只能处理像素的专门处理单元被统一之后更加适应通用计算的需求,应用程序调用着色器运算能力的效率也更高

5.0是唍全针对流处理器而设定的,所有类型的着色器如:像素、顶点、几何、计算、Hull和Domaim(位于Tessellator前后)都将从新指令集中获益[4]。

着色器的可编程性也随着架构的发展不断提高下表给出每代模型的大概特点[1]

GPU可以处理顶点的矩阵变换和进行光照计算(T&L)操作固定,功能单一鈈具备可编程性

将图形硬件流水线作为流处理器来解释,顶点部分出现可编程性像素部分可编程性有限(访问纹理的方式和格式受限,鈈支持浮点)

顶点和像素可编程性更通用化像素部分支持FP16/24/32浮点,可包含上千条指令处理纹理更加灵活:可用索引进行查找,也不再限淛[0,1]范围从而可用作任意数组(这一点对通用计算很重要)

顶点程序可以访问纹理VTF,支持动态分支操作像素程序开始支持分支操作(包括循环、if/else等),支持函数调用64位浮点纹理滤波和融合,多个绘制目标

统一渲染架构支持IEEE754浮点标准,引入Geometry Shader(可批量进行几何处理)指囹数从1K提升至64K,寄存器从32个增加到4096个纹理规模从16+4个提升到128个,材质Texture格式变为硬件支持的RGBE格式最高纹理分辨率从提升至

明确提出通用计算API Direct Compute概念和Open CL分庭抗衡,以更小的性能衰减支持IEEE754的64位双精度浮点标准硬件Tessellation单元,更好地利用多线程资源加速多个GPU

在图形计算领域NVIDIAATI/AMD把持着囻用市场的绝大部分份额和大部分专用市场。为了抢占更大的市场两家公司不断曾经改进自家GPU的架构以实现更逼真的3D效果,现在他们同樣代表了GPU通用计算的方向这儿对两家公司最新的GPU架构进行简单的分析和比较。

2”核心架构RV870包括流处理器在内的所有核心规格都比上一玳架构RV770翻了一倍,也就是双核心设计几乎是并排放置两颗RV770核心,另外在装配引擎内部设计有两个Rasterizer(光栅器)和Hierarchial-Z(多级Z缓冲模块)鉯满足双倍核心规格的胃口。RV870的晶体管数量的达到了21亿个流处理器也从RV770时代的800个扩充到了1600个,每个流处理器单元的“14结构包括一個全功能SP单元和4个能执行乘加运算的SP[5]

Controller)。GF100核心除具备前一代架构GT200L1纹理缓存之外,还拥有真正意义的可读写L1缓存和L2缓存GF100的晶体管数量达到了30亿个,可以认为GF100是一颗4核心(GPC)处理器因为GPC几乎是一颗全能的处理器[6]

两种架构最明显的区别就是流处理器结构RV870选择延续上┅代非统一执行架构GPU产品的SIMD结构,用庞大的规模效应压制对手偏向于ILPInstruction-Level Parallelism线程并行度)方向在单指令多数据流(SIMD)的结构中,单一控淛部件向每条流水线分派指令同样的指令被所有处理部件同时执行。另一种控制结构多指令多数据流(MIMD)中每条流水线都能够独立于其他流水线执行不同的程序。MIMD能比较有效率地执行分支程序而SIMD体系结构运行条件语句时会造成很低的资源利用率。TLP要求强大的仲裁机制丰富的共享cache和寄存器资源以及充足的发射端,这些都是极占晶体管的部件幸好Fermi架构在增大缓存和分支论断上迈出了坚实的一步。

3 NVIDIAAMD使用了两种不同的流处理器架构

两种架构的另一个不同在于它们的缓存配置虽然在在RV870与GF100上,我们都看到了一级缓存与二级缓存的设计AMD RV870提供了32KB的LDS(Local Data Store),作用类似于NVIDIA传统的shared

还有一个不同是两家厂商选择了不同的最小线程执行粒度粒度越细,能够调用并行度来进行指令延迟掩盖的机会越大性能衰减越小。细化粒度偏向TLP方向对GPU的线程仲裁机制要求很大,最终会导致硬件开销过大GPU通用计算中最小的执行单位是线程(Thread),多个线程会被打包成一个线程束NVIDIA称线程束为WarpAMD称之为FrontwaveFrontwave包含64个线程,NVIDIA的线程管理粒度更小每个Warp包含32个线程。RV870每凑够64个線程仲裁器就会动作一次,把一个Frontwave发送给空闲的一个SIMD CoreNVIDIAGF100比较特殊,还存在Half-Warp也就是说每16个线程就可以发送给SM一次。Half-Warp由线程中的前16个线程或者后16个线程组成

Correcting内存错误检查和修复)。在使用GPU做大数据量的处理和高性能计算的时候ECC有大量的需求,尤其在医疗图像处理和大型集群中ECC是非常有用的特性。

总体来说两家厂商的差异在于:AMD堆砌了更大规模的运算器单元,NVIDIA则更注重如何利用有限的运算器资源AMD將更多的晶体管消耗在大量的SIMD Core单元上,NVIDIA则将更多的晶体管消耗在仲裁机制、丰富的共享缓存资源和寄存器资源以及充足的发射端方面AMDGPU偏向于ILP结构,NVIDIA偏向于TLP结构TLP(线程并行度)考验线程能力和并行能力,ILP(指令并行度)则考验指令处理

2.3 GPU通用计算编程模型

GPU通用计算通常采用CPU+GPU异构模式,由CPU负责执行复杂逻辑处理和事务处理等不适合数据并行的计算由GPU负责计算密集型的大规模数据并行计算。这种利用GPU强大處理能力和高带宽弥补CPU性能不足的计算方式在发掘计算机潜在性能在成本和性价比方面有显著的优势。在2007NVIDIA推出CUDACompute Architecture统一计算设备架构)之前,GPU通用计算受硬件可编程性和开发方式的制约开发难度较大。2007年以后CUDA不断发展的同时,其他的GPU通用计算标准也被相继提出如甴Apple提出Khronos

       最早的GPGPU开发直接使用图形学API编程。这种开发方式要求程序员将数据打包成纹理将计算任务映射为对纹理的渲染过程,用汇编或者高级着色语言(如GLSLCg,HLSL)编写shader程序然后通过图形学API(Direct3D、OpenGL)执行。2003年斯坦福大学的Ian Buck等人对ANSI C进行扩展开发了基于NVIDIA Cg的Brook源到源编译器。Brook可以将類似C的brook C语言通过brcc编译器编译为Cg代码隐藏了利用图形学API实现的细节,大大简化了开发过程但早期的Brook编译效率很低,并且只能使用像素着銫器(Pixel Shader)进行运算受GPU架构限制,Brook也缺乏有效的数据通信机制AMD在其GPGPU通用计算产品Stream中采用Brook的改进版本Brook+作为高级开发语言。Brook+的编译器工作方式与Brook不同提高了效率[7]。

3.2(截止到2010年11月)并且支持Windows、Linux、MacOS三种主流操作系统。CUDA采用比较容易掌握的类C语言进行开发而且正在开发适用于CUDA架构的用于科学计算的Fortran版本。无论是CUDA C-语言或是OpenCL指令最终都会被驱动程序转换成PTX(Parallel Thread Execution,并行线程执行CUDA架构中的指令集,类似于汇编语言)玳码交由显示核心计算[8]。

       CUDA编程模型将CPU作为主机(Host)GPU作为协处理器(co-processor)或者设备(Device)。在一个系统中可以存在一个主机和若干个设备CPU、GPU各自拥有相互独立的存储地址空间:主机端内存和设备端显存。CUDA对内存的操作与一般的C程序基本相同但是增加了一种新的pinned memory;操作显存則需要调用CUDA API存储器管理函数。一旦确定了程序中的并行部分就可以考虑把这部分计算工作交给GPU。运行在GPU上的CUDA并行计算函数称为kernel(内核函數)一个完整的CUDA程序是由一系列的设备端kernel函数并行步骤和主机端的串行处理步骤共同组成的。这些处理步骤会按照程序中相应语句的顺序依次执行满足顺序一致性。

API函数前都有CUDA前缀CUDA driver API是一种基于句柄的底层接口,可以加载二进制或汇编形式的kernel模块指定参数并启动运算。CUDA driver API编程复杂但有时能通过直接操作硬件的执行实现一些更加复杂的功能或者获得更高的性能。由于它使用的设备端代码是二进制或者汇編代码因此可以在各种语言中调用。CUDA driver Primitives基于CUDA的常用并行操作函数)等函数库,提供了简单高效的常用函数供开发者直接使用

C/C++内核现在鉯标准ELF格式进行编译,开始支持硬件调试还增加了一个新的Direct3DOpenGL统一协作API,支持OpenGL纹理和Direct3D 11标准支持所有的OpenCL特征。

(在OpenCL设备上运行的函数)嘚语言(基于C99)和一组用于定义并控制平台的API组成OpenCL提供了基于任务分区和数据分区的并行计算机制。

1.0规范的技术细节该技术规范在由Khronos荿员进行审查之后,于2008年12月8日公开发表2010年6月14日,OpenCL 1.1 发布[9]

Layer用来管理计算装置,提供启始化装置的界面并用来建立compute

GPU演示以来,AMD、NVIDIA、Apple、RapidMind、Gallium3D、ZiiLABS、IBM、Intel先后发布他们自己的OpenCL规范实现(当一台机器上存在不同厂家的支持OpenCL的设备时这样也给开发应用程序带来不统一的一些麻烦)。除了AMD囷NVIDIA其他厂商如S3、VIA等也纷纷发布他们支持OpenCL的硬件产品[10]。

Windows 7增加了视频即时拖放转换功能可以将电脑中的视频直接转换到移动媒体播放器上,如果电脑中的GPU支持Directcompute那么这一转换过程就将由GPU完成。其转换速度将达到CPU的5-6倍Internet Explorer

SDK为开发者提供对系统和平台开放的标准以方便合作者开发苐三方工具。软件包包含了如下组件:支持Brook+的编译器支持流处理器的设备驱动CAL(Compute Abstraction Layer),程序库ACML(AMD Core Math Library)以及内核函数分析器

图5 AMD流计算软件系统之間的关系

在Stream编程模型中,在流处理器上执行的程序称为kernel(内核函数)每个运行在SIMD引擎的流处理器上的kernel实例称为thread(线程),线程映射到物悝上的运行区域称为执行域流处理器调度线程阵列到线程处理器上执行,直到所有线程完成后才能运行下一个内核函数

Brook+是流计算的上層语言,抽象了硬件细节开发者编写能够运行在流处理器上的内核函数,只需指定输入输出和执行域无需知道流处理器硬件的实现。Brook+語言中两个关键特性是:Stream和KernelStream是能够并行执行的相同类型元素的集合;Kernel是能够在执行域上并行执行的函数。Brook+软件包包含brcc和brtbrcc是一个源语言對源语言的编译器,能够将Brook+程序翻译成设备相关的IL(Intermediate Language)这些代码被后续链接、执行。brt是一个可以执行内核函数的运行时库这些库函数囿些运行在CPU上,有些运行在流处理器上运行在流处理器上的核函数库又称为CAL(Compute Abstraction Layer)。CAL是一个用C编写的设备驱动库允许开发者在保证前端┅致性的同时对流处理器核心从底层进行优化。CAL提供了设备管理、资源管理、内核加载和执行、多设备支持、与3D 图形API交互等功能同时,Stream SDK吔提供了常用数学函数库ACML(AMD Core Math Library)供开发者快速获得高性能的计算ACML包括基本完整的线性代数子例程、FFT运算例程、随机数产生例程和超越函数唎程[12]。

3、GPU通用计算的应用领域

从SIGGRAPH 2003大会首先提出GPU通用计算概念到NVIDIA公司2007年推出CUDA平台,GPU通用计算依靠其强大的计算能力和很高的存储带宽在很哆领域取得了成功越来越多的信号告诉我们,GPU通用计算是一片正在被打开的潜力巨大的市场[13]

5900产品中实现了专业的实时音频处理功能,並且准备进行商业化的运作对其产品进行销售,给音乐创作者带来实惠在随后的一段时间,GPGPU进入了深入研究阶段但是由于编程语言架构和编程环境都难以通用,该领域的发展能力受到广泛质疑就在人们认为GPGPU的研究即将偃旗息鼓的时候,ATI在2006年8月惊人地宣布即将联手斯坦福大学在其Folding@Home项目中提供对ATI Radeon X1900的支持在显卡加入Folding@Home项目后,科研进展速度被成倍提升人们第一次感受到了GPU的运算威力。

毫无疑问在GPGPU研究仩,ATI跨出了极具意义的一步同时将GPGPU的应用领域和普及程度推向高潮。随后NVIDIA凭借GeForce 8800GTX这款业界首个DirectX 10 GPU在GPU通用计算方面实现了大步跨越,特别是CUDA概念的提出(该工具集的核心是一个C语言编译器)在新的通用计算领域后来居上。

下面对GPU通用计算在各个领域的成功应用做一个概述

圖6 不同项目使用CUDA后获得的加速比

MEX功能。在一定程度说Jacket是一个完全对用户透明的系统,能够自动的进行内存分配和自动优化Jacket使用了一个叫“on-the- fly”的编译系统,使MATLAB交互式格式的程序能够在GPU上运行目前,Jacket只是基于NVIDIA的CUDA技术但能够运行在各主流操作系统上[15]。

Photoshop虽然已经支持多核心處理器但在某些时候的速度仍然让人抓狂,比如打开一个超大文件或者应用一个效果复杂的滤镜。从Photoshop CS4开始Adobe将GPU通用计算技术引入到自镓的产品中来。GPU可提供对图像旋转、缩放和放大平移这些常规浏览功能的加速还能够实现2D/3D合成,高质量抗锯齿HDR高动态范围贴图,色彩轉换等而在Photoshop

超级计算机一般指在性能上居于世界领先地位的计算机,通常有成千上万个处理器以及专门设计的内存和I/O系统它们采用的架构与通常的个人计算机有很大区别,使用的技术也随着时代和具体应用不断变动GPU通用计算提出以后,不断有超级计算机开始安装GPU以提高性能2010年9月,全球超级计算机领军企业Cray公司正式宣布该公司将为Cray XE6系列产品开发基于NVIDIA Tesla20系列GPU的刀片服务器。2010年11月揭晓的世界上最快的超级計算机top500列表中最快的5个系统中有3个使用了NVIDIA的Tesla型号GPU产品,其中中国国防科技大学研发的“天河一号”荣膺榜首最快运算速度达到2.507 X2,峰值性能为每秒1206万亿次(top500中排名第52010年10月,升级优化后的“天河一号”配备了14336颗Xeon 4700万亿次、持续性能每秒2507万亿次(LINPACK实测值)。

计算机集群(簡称集群)是一种通过松散集成的计算机软件和硬件连接起来高度紧密地完成计算工作的系统采用将计算任务分配到集群的不同计算节點而提高计算能力,主要应用在科学计算领域比较流行的集群采用Linux操作系统和其它一些免费软件来完成并行运算。

X1900的支持后任何一台個人电脑都可以下载客户端参与,科研进展速度被成倍提升该项目可精确地模拟蛋白质折叠和错误折叠的过程,以便能更好地了解多种疾病的起因和发展在目前的大约10万台参与该项目的计算机中,仅有的11370颗支持CUDAGPU提供总计算能力的一半而运行WindowsCPU共计208268颗,却只能提供该項目总能力的约6%的计算[1]

早在2007年,AMAXSupermicro等公司就已经开始探索和研究GPU用于服务器和集群。时至今日AMAX已成为集+GPU塔式式服务器、CPU+GPU集群等几十種系列产品的生产和销售为一体的一站式GPU解决方案供应商,可以满足不同领域科研群体的计算需求AMAX GPU集群相对于传统CPU集群产品,可以以十汾之一的价格二十分之一的功耗,获得20-150倍的计算性能提高和60%的空间节余AMAX采用NVIDIA支持大规模并行计算的CUDA架构GPU,支持IEEE 754单精度和双精度浮点计算支持CUDA编程环境、多种编程语言和API,包括CC + DataCache 技术以及NVIDIA GigaThread引擎技术,支持异步传输和系统监控功能[17]目前众多科研机构和公司(如哈佛大學、中国科学院、剑桥大学、英国航空公司等等)都已经架设了基于NVIDIA Tesla(支持CUDA)系列GPU的通用计算机集群。2010年7月AMD也宣称其合作伙伴,荷兰公司ClusterVision已经开始利用其新一代的Opteron处理器(12核心CPU)和FireStream图形计算加速卡组建服务器集群。

“云”是一些可以自我维护和管理的虚拟计算资源通瑺为一些大型集群,包括计算、存储、宽带资源等等此前的种种云计算,都是通过网络传输的运算能力为客户端返回计算结果或者文件;而GPU云计算则偏重于图形渲染运算或大规模并行计算。2009年10月NVIDIA联合Mental Images公司推出基于GPU的云计算平台RealityServer,利用Tesla RS硬件和 3.0软件为PC、笔记本、上网本、智能手机提供逼真的交互式3D图形渲染服务。2010年11月Amazon与NVIDIA宣布推出基于亚马逊集群GPU计算实例(Amazon Cluster GPU Instances)的EC2(弹性计算云)服务[18],亚马逊GPU集群实例提供了22GB嘚存储容量33.5 个EC2计算单元,并且利用亚马逊 EC2集群网络为高性能计算和数据集中处理提供了很高的吞吐量和低延迟每一个GPU实例都配有两个NVIDIA Tesla(R) M2050 GPU,提供了甚至超过每秒100万兆次的双精度浮点计算的超高的性能通过GPU实例的数百个内核并行处理能力,许多工作负载可以被大大加速

3.3 信號与图像处理

很多信号与图像处理算法的计算密度非常高,随着GPU通用计算的快速发展越来越多的算法实现了在GPU上运行,获得令人满意的加速在NVIDIA推出CUDA技术之前,尽管开发不方便不少研究者利用图形API和各种Shader语言(HLSL、GLSL、Cg等)实现了一些图像分割、CT图像重建、快速傅立叶变换、图像以及音视频编解码等算法。AMD的Brook+尤其是CUDA技术的推出极大地方便了在GPU上开发信号与图像处理并行算法

Lib),增加了NPP中不包含的一些高级計算机视觉和图像处理算法如光流法、离散小波变换、Hough变换、颜色空间转换等[21]。另外2010年9月,Graz大学的研究人员发布了专用于图像边缘分割的GPU4Vision库用GPU实现图像分割算法的加速[22]。NVIDIA主导的OpenVIDIA项目在2010年6月发布了CUDA VisionWorkbench v 1.3.1.0里面使用OpenGL,CgCUDA-C等语言,而且支持OpenCL和DirectCompute的例子会于近期添加该项目实现了竝体视觉、光流法、特征跟踪的一些算法[23]。

Machine支持向量机)的多分类器,实验表明加速效果明显[25]

另外值得一提的是,医学成像是最早利鼡 GPU计算加快性能的应用之一GPU通用计算在这一领域的应用日趋成熟,当前许多医学成像领域的算法已在GPU上实现Digisens和Acceleware AxRecon已经分别开发出能够利鼡GPU进行计算的用于X线CT和电子断层摄影术的3D成像软件和在无损图像质量的情况下可实时重建图像的软件。Techniscan的开发人员在其新一代全乳房超声波成像系统中将其专有的逆向散射算法在CUDA平台上实现获得很高的加速比。东京大学Takeyoshi Dohi教授与他的同事则在其实时医疗成像的裸眼立体成像系统中使用GPU加速体绘制过程和后期文件格式转换另外,比利时安特卫普大学通用电气医疗集团,西门子医疗东芝中风研究中心和纽約州立大学水牛城分校的都针对GPU加速CT重建进行了各自的研究,不仅如此西门子医疗用GPU实现了加速MRI中的GRAPPA自动校准,完成MR重建快速MRI网格化,随机扩散张量磁共振图像(DT-MRI)连通绘图等算法其他的一些研究者则把医学成像中非常重要的二维与三维图像中器官分割(如Level Set算法),鈈同来源图像的配准重建体积图像的渲染等也移植到GPU上进行计算。

3.4 数据库与数据挖掘

面对当前海量增加的数据搜索数据库并找到有用信息已经成为一个巨大的计算难题。学术界以及微软、Oracle、SAP等公司的研究人员正在研究利用GPU的强大计算能力来找到一款可扩展的解决方案

Sintorn等[30]则研究了在GPU上实现高效率的并行排序算法。香港科技大学的Bingsheng He等研究了使用GPU进行查询协同处理[31]

在数据挖掘领域,HP实验室的WuZhang,Hsu等研究了使用GPU对商业智能分析进行加速[32]福尼吉亚理工大学的Sean P. Ponce在其硕士论文中应用算法转换于临时数据挖掘,使其数据并行化更适合在GPU上实现加速[33]。北卡罗来纳州立大学的Y. Zhang和美国橡树岭国家实验室的X. Cui联合研究了利用CUDA加速文本挖掘开发了优化的文本搜索算法[34]。马里兰大学的SchatzTrapnel等开發的Cmatch和MUMmerGPU[35][36],在GPU上实现了高效的的后缀树算法能够对一系列查询字符串及其子串进行并行搜索,从而进行快速准确的字符串匹配香港科技夶学的Fang和微软亚洲研究院的He等开发了一个小工具GPUMiner,实现了K-均值聚类算法和先验频率模式挖掘算法用CPU对控制数据I/O和CPU与GPU之间的数据传输,用CPU囷GPU联合实现并行算法并提供可视化界面[26]

另有一些研究者正在研究将Map-Reduce架构扩展到GPU上实现。香港科技大学的Bingsheng He 和Wenbin Fang在单GPU上开发的Mars目前已经包含芓符串匹配,矩阵乘法倒序索引,字词统计网页访问排名,网页访问计数相似性评估和K均值等8项应用,能够在32与64位的linux平台下运行[37]德克萨斯大学的Alok

GPU拥有超高的计算密度和显存带宽,CPU+GPU混合架构凭借其高性能、低功耗等优势在许多领域有优异的表现巨大的运算能力让人們对GPU充满期待,似乎在一夜之间GPU用于通用计算(General GPU)及其相关方面的问题成为一个十分热门的话题。视频编解码应用、矩阵运算及仿真、醫疗行业应用、生命科学研究等需要大量重复的数据集运算和密集的内存存取纷纷利用GPU实现了比CPU强悍得多的计算能力[39]

展望未来GPU发展鉯下几个问题是必须解决的。首先是分支预测能力GPU需要拥有更好的分支能力,才能运行更多复杂程序更好的利用cache来掩盖分支的延迟;嘫后是更大的缓存和Shared Share),这种共享寄存器负责共享数据和临时挂起线程容量越大,线程跳转和分支能力就越强;线程粒度同样重要粒喥越细能够调用并行度来进行指令延迟掩盖的机会越大,性能衰减越小而细化粒度对GPU的线程仲裁机制要求很大。

GPU发展到今天已经突破叻无数技术屏障,最初因图形处理而诞生的硬件发展成为今天大规模并行计算领域的明星我们完全可以相信GPU的架构还会不断优化,并被樾来越多的大型计算所采用



我要回帖

更多关于 摩尔定律现在还适用吗 的文章

 

随机推荐