OB电竞:核算机算力专题研讨:助力数字经济人工智能敞开算力年代

发布时间:2022-11-18 02:51:41 作者:ob欧宝体育直播 出处:ob欧宝下载 字号

  1980 年曾经:数据会集在数据中心存储与处理,即便可经过长途拜访,终 端核算才干低下,也无法对数据进行深度核算,数据均为商用。

  1980-2000:摩尔定律显威,PC 鼓起,数据的发生、处理与存储更多流向 终端,一起呈现了音乐、电影和游戏的数字文娱工业。

  2000 至今:无线宽带遍及推进数据进入云端,将数据与特定的物理设备脱 钩。社交与流媒体的鼓起使得数据中心更多承当数据交互与会集核算使命, 而在不断交互过程中数据量高速添加。

  数据量呈现指数级添加,企业端占比不断进步。依据我国信通院,到 2035 年, 全球数据量将达 2142ZB(ZB:Zettabyte,1ZB 约十万亿亿字节),是 2020 年所创立数据量的 45-46 倍。而因为进入云年代,数据在本地存储的需求逐渐 削减,企业在云端可为客户供给实时的数据和服务。

  数据逐渐成为经济开展的重要出产要素。依据云能够快速拜访的数据运用办法, 数据日益影响企业和日常日子,例如商业航空游览、自动驾驶、医疗运用、操控 体系和遥测技能等社会出产力严密相关的数据占比继续进步。IDC 估计到 2025 年,文娱相关的消费型数据占比将从 2012 年挨近 60%下降至 30%左右,余下 约 70%将对错文娱化的图画/视频、出产力数据、工业出产等嵌入式数据。

  重要数据量快速添加。不同数据间的重要性相差较大,例如:医疗类数据重要于 流媒体数据,不同数据运转呈现问题所构成的影响亦不同,例如私用 PC 宕机造 成文件丢失和自动驾驶数据过错构成人员伤亡。IDC 估计未来要害数据量增速将 高于数据量全体添加,2025 年需求安全防护的企业经营/医疗记载等数据占比将 达 87%。

  单个数据的价值下降,多维数据整合方可开掘深度价值,进一步催生算力需求。 当时数据指数级添加的一起,数据类型也愈加多元化,在交通、工业、商业运营 等范畴,少数、单一化的数据的价值较低,只要将很多、多维度的数据进行归纳 剖析才干发生应有的价值。例如交管范畴关于黑车的辨认,需求将车辆行进轨道、 车辆图画辨认、人像辨认与比照、车牌挂号数据比对等多维度数据进行剖析才干 精确挑选。关于杂乱的不同类型数据(特别非结构化的)一致剖析与存储的需求 催生了数据湖概念,一起跟着云核算技能的深化运用,带来资源集约化和运用灵 活性优势的云原生概念也发生,大规划集群核算需求旺盛。

  全球超级数据中心占比快速进步,算力进一步会集。近五年全球数据中心使命量 添加 135%,大数据开掘与运用、人工智能深度学习需求旺盛,跟着摩尔定律逐 渐走向极限,超级数据中心成为数据中心首要增量。依据 Cisco 数据,全球超级 数据中心打造服务器数量占全部数据中心搭载服务器份额由 2016 年的 27%提 升至 2021 年的 53%。

  算力已成为数字经济年代的要害出产力要素。在传统的西方经济学理论中,驱动 社会经济开展的出产要素包含了劳作、本钱、土地、企业家的才干等。而在一系 列新式信息数字技能的鼓起与广泛运用的数字经济年代中,与核算才干的构成直 接相关的算力本钱投入(数据、算力、算法),好像农业年代的水利、工业年代的 电力,已成为数字经济开展的中心出产力,是国民经济开展的重要根底设备。国 务院印发的《“十四五”数字经济开展规划》中也清晰提及到 2025 年我国数字 经济中心工业添加值占 GDP 比重将从 2020 年的 7.8%上升到 10%,数字经济 将为经济社会继续健康开展供给继续动力。

  中美算力规划全球抢先。到 2021 年末,全球数据中心算力总规划达 521EFLOPS(EFLOPS:每秒进行 10^18 次浮点运算)。中美两国算力规划分 别约为 161EFLOPS 和 140EFLOPS,占全球总算力份额约为 31%和 27%。

  核算力和 GDP 添加显着相关。依据 IDC 等组织的研讨,全球均匀来看,他们构 建的“核算力指数”每进步 1 个点,国家数字经济和 GDP 将别离添加 3.5‰和 1.8‰。一起,“核算力指数”越高,对 GDP 的拉动效果越显着。

  大数据年代,算力与数据添加齐头并进。依据《我国算力白皮书(2022 年)》的 数据,2021 年我国算力总规划到达 140Eflops(每秒一万四千亿亿次浮点运算, 包含通用算力、智能算力、超算算力,边沿算力暂未归入核算规划),全球占比约 为 27%,近五年年均增速超 30%。展望未来,工信部印发的《“十四五”信息通 信职业开展规划》指出 2025 年我国数据中心算力总规划将添加到 300EFLOPS, CAGR 达 22%;另一方面,随同 5G、人工智能、物联网等技能的运用遍及, 数据流量添加快率也在不断加快。依据 IDC 的猜测,全球数据总量在 2020 年 将达 50ZB,而这一数据到 2025 年有望到达 175ZB,CAGR 达 28%。与此同 时,依据中心网信办的数据核算,2019 年度我国移动互联网数据接入量为 1,655.50 亿 GB,估计 2024 年将到达 5,680.90GB,CAGR 也高达 28%。因 此,咱们以为在当时数字经济大年代下,适度超前建造以数据中心为首的新式基 建具有清晰的战略含义。

  “东数西算”正式发动,估计每年带动 4000 亿出资。本年二月,国家开展变革 委、中心网信办、工业和信息化部、国家动力局联合印发告诉,赞同在京津冀、 长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 地发动建造国家 算力纽带节点,并规划了 10 个国家数据中心集群,标志着“东数西算”工程正 式全面发动。与“西气东输”“西电东送”“南水北调”等工程类似,“东数西 算”是一个国家级算力资源跨域分配战略工程,针对我国东西部算力资源散布总 体呈现出“东部缺乏、西部过剩”的不平衡局势,引导中西部运用动力优势建造 算力根底设备,“数据向西,算力向东”,服务东部滨海等算力紧缺区域,处理 我国东西部算力资源供需不均衡的现状。“东数西算”工程对我国的久远开展有 重要的含义:

  有利于进步国家全体算力水平:经过全国一体化的数据中心布局建造,扩展 算力设备规划,进步算力运用功率,完结全国算力规划化集约化开展。

  有利于促进绿色节能:数据中心归于高耗能职业,又被称为“不冒烟的钢厂”。 将数据中心从能耗目标严重的东部地区迁往清洁动力富集、电力愈加廉价的 西部,将大幅进步绿色动力运用份额,下降数据中心运营的本钱。

  有利于扩展有用出资:数据中心工业链条长、出资规划大,带动效应强。发 改委估计“十四五”期间大数据中心出资还将以每年逾越 20%的速度添加, 每年估计各方面出资额达 4,000 亿元。

  有利于推进区域协调开展:经过算力设备由东向西布局,将带动相关工业有 效搬运,促进东西部数据流转、价值传递,延展东部开展空间,推进西部大 开发构成新格局。

  AI 算量需求急剧添加,传统架构难以满意。依据摩尔定律,集成电路上能够包容 的晶体管数目大约每 18 个月添加一倍,而 AI 练习算量自 2012 年开端以均匀 每 3.43 个月翻倍的速度完结指数添加。在芯片制程到达个位数纳米级的当下, 传统芯片算力进步速度难以赶上核算量增速。

  下流运用的高景气量和不断衍生的智能化需求,推进芯片改造。我国云核算商场 规划添加敏捷,2021 年到达 3229 亿元,近 5 年 CAGR 达 44.6%。云核算作 为人工智能云端练习芯片的首要运用场景,推进了芯片架构迭代。

  GPU 是当时干流数据中心端 AI 核算架构。按技能架构分类,AI 芯片可分为图 形处理器(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、类脑 芯片。GPU 起先着重图形处理,跟着强壮的并行核算才干被开掘,逐渐进入通 用核算范畴;FPGA 以半定制化为特征,注重于服务笔直范畴;ASIC 则是针对 客户运用场景需求进行定制;类脑芯片尚处于起步阶段。

  智能算力需求旺盛,GPU 充沛获益。从商场规划来看,2021 年服务器 GPU 全 球商场规划到达 71.5 亿美元,2019-2021 年复合增速 66%,占服务器全体市 场规划份额快速进步;同期 FPGA 全球商场规划为 7.9 亿美元,比较 2020 年 底子相等;而 ASIC 首要用于终端推理。咱们以为,中期看 GPU 仍将是数据中 心端 AI 练习等加快核算的干流芯片,充沛获益于智能算力高景气。

  Nvidia:2022 年上半年数据中心收入占比逾越 50%。获益于智能算力高景气, Nvidia 作为全球 GPU 龙头,数据中心事务占比历年快速进步,由 2014 年的 6.8%,进步至 2022 年上半年的 50.4%,是首要收入添加动力。

  AMD:数据中心端发力,抢占 X86 商场。AMD 于 2016 年发布 Zen 架构,相 比 Intel 的 IDM 形式,AMD 的 fabless 形式在当时芯片制程挨近极限布景下更 具优势,凭借全球抢先 foundary 厂抢先于 Intel 本身的制程优势,功用继续追 赶。特别在服务器 CPU 方面,是 AMD 抢占 intel 商场的首要发力点,在 X86 芯片的商场份额继续进步至 2021Q4 的 10.7%。

  Nvidia 和 AMD 市值双双逾越 Intel,年代算力从 PC 端走向集群 AI 端。得益于 Nvidia 在数据中心商场的微弱体现和 AMD 在服务器 CPU 商场的发力,现在它 们的市值均已逾越 Intel,虽然 Intel 现在的收入和赢利体量显着高于 Nvidia 和 AMD,可是本钱商场给予后两者估值溢价显着,标志着年代算力正从传统的 PC 端走向服务器的 AI 集群,工业浪潮不可逆转。

  AI 职业快速开展,智能算力需求进步。依据运用设备和供给算力强度的不同,算 力可分为根底算力、智能算力与高端算力三大类。跟着深度学习技能的快速开展, 以及互联网和云核算年代海量数据和高效核算才干的支撑,核算机视觉技能、语 音技能、自然言语了解技能等人工智能技能取得了打破性开展,并解锁多个职业 的人工智能场景,驱动了人工智能职业相关的核算量快速添加。依据《我国算力 白皮书(2022 年)》的数据核算,2021 年全球智能算力总规划达 113EFLOPS, 占全球总算力规划的 22%。咱们以为,随同人工智能技能的杂乱性不断添加,人 工智能核算才干的需求将呈指数级添加。

  AI 三要素彼此耦合,一起生成 AI 模型。一个传统的 AI 模型包含练习和揣度(预 测)两大部分。练习环节指将练习数据(一般为现有的历史数据)输入进算法中, 经过 AI 芯片(GPU、FPGA 等)供给算力支撑,以及数据工程师的剖析调参, 最终出产满意特定功用的 AI 运用模型。揣度环节指经过向练习完结的 AI 运用模 型中输入实践运用场景中的新数据,并出产对应的揣度成果。在这一过程中,数 据、算法和算力扮演着平等重要的人物,三要素的耦合联系是探究 AI 未来开展 路途的重要根底:

  数据是 AI 模型的“汽油”:数据是全部人工智能的根底。数据因其可具象性 强,也是最简单被了解的竞赛壁垒(特斯拉在自动驾驶数据的堆集、科大讯 飞在才智教育的题库数据堆集等)。未来数据的打破口在于 1)数据堆集的 职业下沉(智能化浸透率的进步,传感技能的晋级等);2)现有数据的打通 (完结将不同职业,政府与企业间的数据互联互通);因而,在特定职业具 备数据堆集先发优势和跨职业数据整合才干的公司有望构成坚持抢先。

  算力是 AI 模型的“发动机”:算力是最简单被直观量化的目标(英伟达每年 推出的新 GPU 参数),但也是现在最大的瓶颈。算力的瓶颈并不体现在算 力的肯定巨细,而在于完结该算力的本钱。特别是在算法场景很多、迭代速 度较快的 AI 范畴,怎么规划出一起满意通用性和高算力的 AI 芯片仍是当下 炙手可热的论题。因而,具有由单一芯片形式往交融异构多芯片形式开展能 力的公司有望首先获益。

  算法是 AI 模型的“大脑”:算法是 AI 完结技能跃迁的底子,也是最难以被 直观了解的部分。从 AlexNet 从头复兴神经网络到 Transformer 敞开大模 型年代,人工智能的每一次里程碑事情都伴跟着算法层面的打破与立异。往 后展望,一个好的算法除了能更好的完结设定的使命外,还需具有 1)更强 的通用性(激活更多的可用数据);2)更优化的核算原理(削减算力的担负)。 因而,咱们以为在 AI 范畴具有科研资源和资金实力的公司将有望拔得头筹。

  深度神经网络模型为 AI 职业注入新动能。英国数学家阿兰·图灵在 1950 年提 出了“机器能考虑吗”这一跨世纪的出题, 人类从未中止过对智能化的考虑与探 索。自 1956 年达特茅斯会议上初次提出人工智能概念以来,人工智能技能与应 用现已开展 60 多年,阅历了屡次高潮和低谷。曩昔的十年间,咱们有幸见证了 深度学习的鼓起为职业的开展注入的惊人的生机:

  2012 年 AlexNet(一种卷积神经网络模型)引入了运用 GPU 并行运算, 以压倒性的精确率夺得了当年 ImageNet 图画辨认大赛的冠军,带来了深 度神经网络的又一次复兴。

  2016 年 DeepMind 开发的人工智能 AlphaGo 打败人类顶尖棋手李世石, 敞开了人工智能开展的新纪元。

  2017 年 Google 团队提出的 Transformer 模型横空出世,成为了日后自 然言语学习(NLP)、核算机视觉(CV)的架构规范;依据 Transformer 的 预练习模型 BERT 更是将 NLP 模型的精准度和泛化才干带上了新的台阶。

  随同场景与数据的激增,大模型或许成为规划化立异的根底。大模型指经过超大 规划的参数设置和数据输入,经过大算力和大数据,以及强壮的算力支撑与练习, 而得出的根底的、具有通用性的、归纳的大模型。大模型浪潮最早起源于预练习 模型,Google 发布的 BERT 模型便是自然言语处理范畴最为典型的预练习模 型。OpenAI 则提出了 GPT 模型,特别是 2020 年发布的 GPT-3 模型参数量 即到达 1750 亿,在全球掀起大模型的浪潮。大模型能够使人工智能具有处理语 言、视觉、机器人、推理、人际互动等各类相关使命的才干。因而这类模型将赋 能各行各业,加快传统职业的智能化转型,在法令、医疗、教育等范畴都会带来 积极影响。例如 Meta 推出的具有 150 亿个参数的 ESMfold 模型能够在原子大 小的精度上猜测蛋白质的三维结构,估测速度比 AlphaFold2 快出一个数量级。 能够说,在 AI 模型开发范畴,阅历了预练习模型-大规划预练习模型-超大规划 预练习模型的演进。

  大模型问世,AI 核算量需求指数添加。如第二章所述,AI 练习算量自 2012 年 开端以均匀每 3.43 个月翻倍的速度完结指数添加,但摩尔定律迫临极限,同期 算力添加仅 7 倍,远低于 AI 模型核算量的 30 万倍。因为完结人工智能所需的 深度学习算法需求很高的内涵并行度、很多浮点核算才干以及强壮的矩阵运算能 力,其与图形烘托有着类似之处,这为运用 GPU 练习深度神经网络打下了理论 根底。自 2012 年 AlexNet 问世之后,GPU 及 AI 加快器(DSA)的广泛运用 使得硬件核算才干的缺乏得以被快速补偿,人工智能职业迎来了又一次加快开展。

  异构核算打破 AI 芯片算力瓶颈。大模型练习、自动驾驶等杂乱运用场景对算力 的寻求没有止境,虽然曩昔 10 年晶体管的数量仍然随摩尔定律添加,但单核处 理器功用现已呈现显着瓶颈,晶体管的数量添加首要来自于中心数量的添加,算 力进步需求寻求新的打破点:

  单个处理器的功用进步:现在集成电路制程工艺的边沿进步极端困难,考虑 到硅原子的直径约为 0.1nm,在 3nm 制程之后量子隧穿效应(Quantum tunnelling effect)会越来越显着。因而,单纯经过改善工艺以进步晶体管密 度,然后进步芯片功用的办法已难以满意大数据和人工智能年代下的事务规 模爆炸性添加。

  处理器的中心数量添加:中心数的添加会进步芯片功耗、本钱,而且需求软 件端适配多核。虽然“东数西算”等项目能从微观层面添加全社会的总算力, 但 AI 芯片大规划落地的条件是满意 AI 场景快速迭代的通用性,不然新增的 算力仍然会呈现运用率低、本钱高。

  处理器的灵敏度进步:跟着算力需求不断攀升,单一核算类型/架构的处理器 无法应对多样的数据处理使命。当时,GPGPU 作为一种异构核算计划,灵敏可编程才干与 AI 算法的需求相对匹配,是现在 AI 算力的干流技能道路。 咱们以为,跟着 Chiplet 技能的逐渐老练,异构并行核算将向架构愈加杂乱 的超异构核算演进,创造出愈加统筹算力和灵敏性的新或许。

  (本文仅供参考,不代表咱们的任何出资主张。如需运用相关信息,请参阅陈述原文。)