深扒欧美AI芯片六大独角兽:世界大芯片、传奇人物加盟、科技巨头联投量产成绩公布等不胜枚举
2021 年,AI 芯片战场依然烽火连天,但国内外却呈现出两番光景。
在国内,BAT 互联网大厂自研 AI 芯片均已揭晓,超 40 家 AI 芯片企业今年拿下新融资地平线,黑芝麻智能,燧原科技,壁仞科技,昆仑芯,摩尔线程等企业的估值均超 100 亿人民币高额融资,新品发布,量产成绩公布等不胜枚举
相比国内的繁荣,欧美 AI 芯片的多数风头却被科技巨头占据,英伟达在云端训练市场风光无二,英特尔继续主导推理市场,率先闯进独角兽阵营的欧美 AI 芯片独角兽仅有 6 家。。
AI 芯片,这一互联网巨头们争相布局的硬科技领域,为何在国外市场没有掀起大量融资浪潮我们从其核心团队,融资情况,发布产品等信息进行了梳理
这 6 家独角兽集中成立于 2016—2017 年,分别是拿到谷歌,英特尔投资的 SambaNova Systems,凭借全球最大晶圆级芯片爆红的 Cerebras Systems,英国唯一 AI 芯片独角兽 Graphcore,由谷歌 TPU 初始团队创立的 Groq,芯片大神 Jim Keller 加盟的 Tenstorrent 以及以色列的 AI 芯片独角兽 Hailo Technologies。
截止 2012 年 12 月欧美 AI 芯片六大独角兽公司融资,产品情况
凭借领先的创新技术与落地进程,这 6 家欧美 AI 芯片独角兽代表,正将影响力辐射至全球科技圈。
一,SambaNova:甲骨文元老,斯坦福教授创立,获谷歌英特尔投资
6 家独角兽中,SambaNova Systems 估值最高,最新一轮融资总额也遥遥领先。
这家美国的 AI 芯片公司成立于 2017 年,总部位于美国加州帕洛阿尔托,2019 年春季已发布第一款 Cardinal 云端训练芯片,落地于美国阿贡国家实验室,美国能源部旗下国家核安全管理局等多个研究机构。
值得一提的是,投资 SambaNova Systems 的投资方不仅包括活跃的投资机构日本软银,淡马锡等,还有谷歌,英特尔等知名科技巨头。
SambaNova Systems 融资情况
今年 4 月,该公司获得最新一轮 6.76 亿美元的 D 轮融资,融资后估值超过 50 亿美元,一举跃升欧美估值最高的 AI 芯片公司。
SambaNova Systems 由曾在甲骨文任职的罗德里戈梁以及斯坦福大学教授昆勒奥鲁克顿,克里斯雷联合创办
SambaNova Systems 创始人昆勒奥鲁克顿,罗德里戈梁,克里斯
其中奥鲁克顿是斯坦福大学芯片多处理器项目的负责人,雷是斯坦福大学计算机科学系副教授,麦克阿瑟天才奖的获得者,并在统计机器学习小组和斯坦福大学 AI 实验室开展研究工作。
2021 年 4 月,SambaNova Systems 推出了其第二代云端 AI 芯片可重构数据流单元 Cardinal SN10 RDU,包含 400 亿晶体管,采用台积电 7nm 制程,由一系列可重构节点组成,用于数据存储和交换每个 Cardinal 芯片有 6 个控制器用于内存,可实现 153 GB / s 的带宽,8 个芯片以全配置连接
SambaNova Systems 第二代云端 AI 芯片 Cardinal SN10 RDU
SambaNova Systems 的 AI 芯片并不会单独出售,而是作为一种安装在数据中心上的解决方案配套出售目前其 SambaNova Systems 的旗舰产品是订阅型的 AI 服务平台 SambaNova DaaS,与其集成软件和硬件系统平台 DataScale 一起使用
SambaNova Systems AI 服务平台 SambaNova DaaS
SambaNova Systems 的 AI 芯片以及它的客户在很大程度上仍处于保密状态其产品自 2020 年以来已进入美国能源部下属的劳伦斯利弗莫尔国家实验室和阿贡国家实验室SambaNova Systems 主要是根据客户需求定制产品,并提供一套默认的网络和管理功能,并由 SambaNova Systems 进行远程管理
二,Cerebras:打造全球最大芯片,今年解锁人脑级AI 模型
2019 年 8 月,美国硅谷创企 Cerebras Systems 推出的世界最大芯片引爆芯片圈今年 4 月,这家公司推出了巨芯二代 WSE—2,可处理超级计算任务,搭载 WSE—2 芯片的 AI 超算系统 CS—2 也同期发布
这家以巨型芯片闻名的独角兽公司成立于 2016 年,总部位于美国加州洛斯阿尔托斯就在今年 11 月 10 日,Cerebras Systems 宣布,获得 2.5 亿美元 F 轮融资,总融资额达到 7.5 亿美元,投后估值超 40 亿美元
Cerebras Systems 融资情况
Cerebras Systems 由加里劳特巴赫和安德鲁费尔德曼联合创立
值得一提的是,加里和安德鲁曾经还联合创办了专注于超高密度计算机服务器业务的 Seammicro 公司,这家公司在 2012 年被 AMD 以高达 3.57 亿美元的价格收购。
Cerebras Systems 创始人安德鲁费尔德曼和加里
今年 4 月,Cerebras Systems 又推出了巨芯二代 Wafer Scale Engine 2,该芯片为超级计算任务而构建,具有破纪录的 2.6 万亿个晶体管和 85 万颗 AI 优化内核,大小类似餐盘,采用台积电的 7nm 工艺。
Cerebras 第二代芯片 WSE—2
今年 8 月,Cerebras Systems 宣布推出世界上第一个人类大脑规模的 AI 解决方案,一台 CS—2 AI 计算机可支持超过 120 万亿参数规模的训练相比之下,人类大脑大约有 100 万亿个突触
此外,Cerebras Systems 还实现了 192 台 CS—2 AI 计算机近乎线性的扩展,从而打造出包含高达 1.63 亿个核心的计算集群。
Cerebras Systems 人脑规模 AI 解决方案的技术组合
目前,Cerebras Systems 的 AI 超算系统 CS—2 只有少数客户可以使用,它的客户集中于军事,实验室等Cerebras Systems 重量级客户包括美国阿贡国家实验室,劳伦斯利弗莫尔国家实验室,匹兹堡超级计算中心,爱丁堡大学的超级计算中心,葛兰素史克,东京电子器件等
三,Graphcore:英国唯一 AI 芯片独角兽,与阿里,百度建立合作
作为闯入中国 AI 芯片市场的少数国外独角兽之一,Graphcore 已经与阿里巴巴,百度建立合作该公司为阿里巴巴的 HALO 专门定制代码,并加入了百度的飞桨硬件生态联盟
这家公司还是英国的唯一一家 AI 芯片独角兽Graphcore 成立于 2016 年,总部位于英国布里斯托尔2020 年 7 月,Graphcore 推出第二代云端训练芯片 GC200
最新一轮融资后 Graphcore 估值达 27.7 亿美元,这使得它成为欧洲市值最高的芯片初创公司。
此前,Graphcore 高级副总裁,中国区总经理卢涛在接受芯东西等媒体采访时谈道,当下 Graphcore 面临唯一的巨头挑战是英伟达而 Graphcore 和英伟达的渊源不止于此,Graphcore 的创始人 Nigel Toon 此前创立的芯片公司 Icera,于 2011 年被英伟达收购
Graphcore 的联合创始人 Nigel Toon和 Simon Knowles
Graphcore 此前共经历了 6 轮融资,最新一轮融资在 2020 年 12 月 29 日公布,融资金额高达 2.22 亿美元,是 6 笔融资中金额最高的Graphcore 已经获得超过 4.5 亿美元的融资,战略投资者不乏宝马,博世,戴尔,微软,三星等各行业巨头
Graphcore 融资情况
Graphcore 的 AI 芯片为智能处理单元 IPU,采用自研大规模并行同构多核架构,包含 1216 个独立 IPU 核心。
Graphcore 研发的 GC200 芯片基于 7nm 工艺,最多可以连接 64000 个芯片来创建一个巨大的并行处理器,其计算能力约为 16 exaFLOPS这样的系统将能够支持具有数万亿个参数的 AI 模型
基于第二代 IPU 芯片 GC200,Graphcore 还构造了大规模系统级产品 IPU—M2000 以及模块化机架规模解决方案 IPU—POD 系统。
Graphcore 的 IPU—POD 系统可以将 AI 计算和服务器进行分解,以优化其解决方案为不同的 AI 工作负载提供最高性能。
Graphcore 的大规模系统级产品 IPU—M2000
值得注意的是,Graphcore 也开始在中国市场大展拳脚Toon 曾在接受采访时说,中国是支持 Graphcore AI 计算应用增长最快的市场,并正式定名为拟未科技Graphcore 将与中国的生态联盟共同推广新的 AI 应用程序,并帮助建立行业标准
在去年 5 月的 Wave Summit 2020 深度学习开发者峰会上,Graphcore 宣布成为百度飞桨硬件生态圈共建计划伙伴之一,加速机器视觉,自然语言处理等算法模型与硬件的适配与落地。
四,Groq:主攻计算机视觉,前谷歌 TPU 团队创立
2016 年底,谷歌 TPU 核心团队中乔纳森罗斯悄悄离职,与同样出身谷歌的道格拉斯怀特曼在美国加利福尼亚创立了一家机器学习系统公司这家公司就是美国的独角兽 AI 芯片初创公司 Groq,它成立于 2017 年,总部位于美国加州山景城
最新一轮融资完成后,该公司估值已超 10 亿美元。
谷歌的 TPU 团队负责研发用于加速机器学习的定制芯片,曾帮助软件程序 AlphaGo击败传奇围棋玩家李世石而 Groq 的创始团队中有 8 名都出身于谷歌的 TPU 核心团队
Groq 创始人乔纳森。罗斯
此前,Groq 共经历 4 轮融资,2021 年 4 月,Groq 获得最新一笔融资,金额为 3 亿美元,由 Tiger Global Management 和亿万富翁 Dan Sundheim 投资该公司前 4 轮融资总额仅为 6230 万美元,新一轮融资完成后,其融资总额达到 3.623 亿美元
Groq 融资情况
2019 年 11 月,Groq 推出了张量流处理器 TSP 架构,该架构是世界上第一个能在单个芯片上每秒执行 1000 万亿次操作的芯片架构,专门针对计算机视觉,机器学习和其他 AI 相关工作负载的性能需求而设计。
Groq 的 TSP 架构受软件优先的启发,能够实现实现计算灵活性和大规模并行性目前已经在 x86 和非 x86 系统的客户站点上运行
同时期,Groq 推出了其首个云端推理芯片 GroqChip,可以实现 16 个芯片间互连和 230 MB SRAM,灵活集成到嵌入式应用中,算力可达 750 TOPS。
GroqChip 还使用 TSP 架构,使其能够在内存中存储更多的模型,以高计算性能处理数据,这使得它非常适合从大型数据集进行推理。
除此之外,该公司坚持以软件为先,其编译器能处理硬件中的控制功能,例如执行计划等Groq 的软件还可精心编排所有数据流和所需时序,以确保计算不会出现停顿,并在编译时完全可预测延迟,性能和功耗
Groq 的产品架构
2020 年,美国阿贡实验室的科学家们使用 GroqChip 创建了 SARS—CoV—2 病毒的机器学习模型。mdash;mdash;在这些未报告收购交易中,在36%的案例中,收购方承担了被收购公司的某些债务和义务。
第一代芯片发布后,Groq 称正在研发第二代新型芯片,但截至现在,还没有检索到二代芯片的相关信息。
罗斯谈到,机器的学习效果是具有随机性的,想要他们正确应对各种复杂的情况是非常困难的,当随机情况发生的时候,需要完成所有可能的计算,才能达到机器学习的最优化,这使得执行起来的成本大大增加而 Groq 的芯片构架就可以为机器学习和 AI 应用带来客观的性能提升
五,Tenstorrent:兼顾高算力和可扩展,获芯片大神加盟
传奇芯片设计大神 Jim Keller 去年 6 月从英特尔辞职后,今年 1 月宣布加盟加拿大 AI 芯片创企 Tenstorrent,担任 CTO 兼总裁。
手握本科学历的 Jim Keller,人送外号硅谷游侠,1998 年从业以来,20 年间辗转于多家大型科技公司,不乏 AMD,苹果,特斯拉,英特尔等顶尖企业,这位技术大牛不断革新半导体行业的发展,屡屡研发出里程碑式的芯片。
2020 年 6 月,这位业界传奇人物从英特尔离职,他的去向备受业界关注但出乎多数人的预期,这个答案在今年 1 月揭晓 ——Jim Keller 选择加盟了一家 AI 芯片公司 Tenstorrent
之所以做出这样的选择,Jim Keller 在接受外媒专访时予以回应:目前爆发性增长的 AI 芯片领域,Tenstorrent 更像是一张白纸我在公司中拥有大量股权,公司 CEO Ljubisa Bajic 也是我的老朋友,无论是基于财务还是对朋友的承诺,我都会选择暂时待在这里
Jim Keller和 Tenstorrent 创始人 Ljubisa Bajic
Tenstorrent 于 2016 年创立,总部位于加拿大多伦多市最新一轮融资完成后,这家公司的估值达到了 10 亿美元的级别2020 年 4 月,Tenstorrent 推出其第一款 AI 芯片 Grayskull,可以兼顾 AI 训练和推理任务
Tenstorrent 此前共经历 4 轮融资,最新一轮融资在 2021 年 5 月 20 日,完成了超过 2 亿美元资金的 C 轮融资,由私募股权机构富达管理领投。
Tenstorrent 融资情况
2020 年 4 月 7 日,Tenstorrent 发布其首款 AI 芯片 Grayskull同年年底,Grayskull 开始量产,并逐渐向早期客户出样
Grayskull 处理器配备 Tenstorrent 定制的 Tensix 能够提供 368 TOPS每个 Tensix 核心具备完全 C++ 可编程,多线程,前端功能,高面积和功率效率矩阵计算引擎,强大灵活的 SIMD 引擎等
Tenstorrent 推出的第一代 AI 芯片 Grayskull
相较市面上现有 AI 芯片产品,Grayskull 不仅能兼顾高算力和低能耗,还具备高度可扩展的特点,可扩展到 10 万个节点,支持从小型嵌入式设备到大型数据中心的 AI 推理和训练任务。
Tenstorrent 的研究人员设计了一个能实现细粒度条件执行,动态稀疏处理的完全可编程体系结构,可将较大数据组的复杂计算任务分解成多个较小数据组的计算,由芯片上的各个内核进行独立的处理。
其研究人员称,该处理器新的架构方法将通过适应模型的确切输入并紧密集成计算和网络,使处理器能够伴随着 AI 模型的持续增长而扩展。
2021 年 6 月,外媒 SemiAnalysis 报道,Tenstorrent 正在研发的第二代 AI 芯片 Wormhole,将更注重训练而不是加速,并捆绑在 16×100 G 以太网端口交换机中。
Jim Keller 加盟后谈道,Tenstorrent 的目标是将高性能的 AI 芯片与一种新方法相结合,利用 AI 来优化低级软件功能,通过这种被称为 Software 2.0 的方法来提高效率和运算速度Jim Keller 将为 Software 2.0 提供所需的硬件解决方案
六,Hailo:以色列独角兽,中国资本参投
以色列 AI 芯片独角兽 Hailo Technologies 成立于 2017 年,总部位于特拉维夫,主打为边缘设备提供数据中心性能以色列国防军以黑科技著称,是以色列科技界的中坚力量,Hailo Technologies 的创始人奥尔达农就来自以色列国防军精英技术小组
Hailo Technologies 的创始人奥尔。达农
今年完成最新一轮融资后,Hailo Technologies 的总估值约为 10 亿美元,正式晋升独角兽企业。
此前,有中国投资公司上海耀途资本参投,这家投资公司聚焦物联网,大数据,云计算及 AI 领域。
该公司共经历 4 轮融资,最新的一轮是 2021 年 10 月 12 日,融资金额为 1.36 亿美元,其融资总额已经达到 2.239 亿美元。
Hailo Technologies 融资情况
目前 Hailo 已推出一款 AI 推理芯片 Hailo—8 及 M.2 和 Mini PCIe 加速模块,分别在 2019 年 5 月和 2020 年 10 月推出,AI 推理芯片 Hailo—8 已经实现量产。
2019 年 5 月,Hailo Technologies 发布了超性能创新架构 AI 芯片 Hailo—8,该芯片性能高达 26 TOPS,并且具有超小的面积和功耗,芯片尺寸均小于 1 美分。
Hailo Technologies 推出的 AI 芯片 Hailo—8
Hailo Technologies 的 Hailo—8 深度学习芯片可在边缘提供数据中心级芯片的性能,同时在尺寸,性能和功耗方面击败竞争的边缘处理器。
2020 年 10 月,Hailo Technologies 宣布推出基于 Hailo—8 芯片 M.2 和 Mini PCIe 高 AI 加速模块,该公司称已经与富士康展开合作,将 M.2 模块整合到其BOXiedge边缘计算平台中。
IBM,英特尔,三星电子,阿里巴巴等跨国科技巨头已经在研发过程中注意到了该公司的技术,它们已经有部分技术引用了 Hailo Technologies 公司的专利。
今年 10 月,Hailo Technologies 称正在努力将其芯片构建到原始设备制造商和一级汽车公司的产品中,这些领域包括先进的驾驶辅助系统以及机器人,医学,智慧城市和家庭等。
结语:AI 芯片产品各异,创企如何突出重围。
经过四五年的磨砺,这 6 家欧美 AI 芯片独角兽的自研芯片产品已经开始走向落地可以看到,多家的首批客户集中于大型实验室,商业化程度还相对有限,其中 Graphcore 已率先发力中国市场
与此同时,系统化已经是今年 AI 芯片产业呈现的一大趋势AI 芯片独角兽在其自研芯片的基础上,已经陆续打造从板卡,服务器,软件到集群的更完整系统级解决方案,并公布更多的应用案例,来展现其技术实力和商用价值
相比国内,欧美 AI 芯片创企面临的生存压力往往更甚,它们直面英伟达,英特尔等芯片巨头已经构筑的深厚生态壁垒,又缺少国产化替代等外部环境特定的激励,此前有些 AI 芯片创企已经被巨头企业收购,也曾有明星企业走向破产重组。
作为 AI 技术的底层驱动,AI 芯片行业发展态势不可逆转,更多半导体大公司,互联网巨头和创业公司开始布局这一领域而如何在一众强手中突出重围,将是 AI 芯片企业们面临的关键考验
。