强强联手！百度智能云携手NVIDIA，共同助力大模型应用落地

2023-10-25 16:01:02 网络阅读量：14440 会员投稿

AI大模型在生物医药领域到底都有怎样的前景？百度智能云与NVIDIA在生物医药行业的成果又有哪些？

为了探索这些问题，本次药智访谈专访百度智能云泛科技行业总经理张玮，NVIDIA互联网行业大客户总监刘川，为我们深度解析AI大模型以及它对制药行业带来的影响！

Q：大模型领域现在发展如何？它的发展趋势又是怎样的？

张玮：大模型的发展非常之快，可谓日新月异，这波热潮是从去年ChatGPT的发布开始席卷全球。

实际上从百度的角度来说，我们对大模型整个的研发非常早，早在2019年文心系列的大模型就已开始研发。10月17日，我们发布了最新的文心大模型4.0版本。透过大模型的演进和发展可以看到，随着算力数据和算法的不断提升，新的大模型在不断增强，从而改变各个行业。

第一个带来改变的是传统信息产业，也就是互联网行业。可以看到已经出现非常多成功的产品，并且在被用户所使用。而随着模型能力的增强，以及更多的垂直行业与大模型行业融合发展，比如生命科学行业，可预见会有越来越多结合大模型能力、垂直行业的知识、应用场景以及研发方向的行业大模型出现。在此趋势之下，我认为大模型可以为垂直行业创造更多的价值，具有巨大的想象空间和发展前景。

Q：目前大模型领域在国内外市场的竞争都非常激烈，那么大模型领域面对的挑战有哪些？

刘川：目前大模型在落地层面有两个阶段，也是最具挑战的两阶段。

第一阶段是要训练一个FoundationModel（基础模型），这是极具挑战性的事情。首先是要求企业要有足够多的数据、要有能力将数据变成token，并应用于整个数据工程，这个过程非常考验技术实力。其次，训练一个FoundationModel需要万卡以上的集群，我们要思考万卡集群在训练过程中，如何让算力的有效利用率达到极致，这对整个技术团队和整个资源管理团队充满挑战。

第二阶段是在训练好FoundationModel之后，落地到行业里需要解决的核心问题——怎么把行业数据/know-how迁移到行业模型里，让行业模型既能学到行业知识，又不降智，而恰恰这些智能是需要从行业实践中得出的。

所以从整个市场来说，百度目前是处于领先地位，百度文心大模型早在2019年就已开始研发，并不断累积经验进行更新迭代，也正因如此，才能使其走在大模型研发的最前沿，才能第一个发布中国的4.0版本大模型。

事实上，各个行业的早期客户已有很多进入大模型的第二阶段的验证中，这些都是来自应用场景的直接挑战，它需要企业逐步把数据放进来，把效果做出来，把精度调上去。这些工作需要全部落地、很辛苦，但唯有脚踏实地的做好，才能把模型真正做到应用落地并达到好的效果。

以上这两个阶段是我认为大模型从FoundationModel到进入行业的两个非常重要的阶段。

Q：我们的企业在这样的竞争潮流中怎样才能有效提升自己的竞争优势？

刘川：我们可以看到现在的企业有几类。

第一类是企业应用相对简单，直接拥抱大模型，尽快调用FoundationModel，让能力跟业务相适配，进而把业务流的效率提升上去。

第二类是对于一些垂类领域的行业，尤其是在具有高壁垒的领域行业中，如医药、制造、金融领域等，这些行业有非常深厚的行业know-how，需要类似百度这样的计算机算法科学家及其提供的大模型，和企业业务侧的行业专家，以及助力AI业务加速的NVIDIA的高级工程技术团队三方联合在一起，快速融合，才能让大模型能力变成行业的先进生产力，助力企业在相应领域中成为最领先的player，带来行业格局的改变。

Q：针对刚刚所提及的两个阶段的挑战，NVIDIA和百度分别可以提供哪些帮助，来助力大模型领域突破瓶颈？

张玮：首先在算力层面，百度智能云跟NVIDIA紧密合作。在大模型的算力基础之上，结合应用及训练过程做非常多的软件开发，充分发挥双方的技术，通过合作使整个大模型的基础设施变得更强大。

此外，百度智能云千帆大模型平台是围绕模型训练、模型生命周期管理的一套AI生产工具，也是面向企业的一套工具链平台。它可以方便企业应用该平台管理数据，管理训练过程，还可以通过平台去使用AI的基础算力，获得更多关于模型应用相关的服务。

算力与百度智能云千帆大模型平台这两个部分形成了与企业客户合作的底座。

同时，百度智能云也为企业提供大模型API调动服务，客户可以通过直接调用文心的API，将API集成到自己的业务流程当中，利用大模型的能力增强自身产品的竞争力，乃至可以利用上述的三种服务去做自己真正的AI原生应用。

刘川：刚才已经说到百度智能云从资源、从环境、从整个工具链层面已经提供了一个非常好的基础设施来支持大模型的运用，那么NVIDIA和百度智能云的合作是在做什么？

我们知道，头部客户以及其场景模型是非常个性化的，模型所追求的也是极限效果，所以NVIDIA和百度智能云的合作就是一起把模型在刚才所述的资源上联合做极致优化。我们希望头部大模型不仅要在业务侧有真正意义的指标收益，更重要的是在整个端到端的pipeline落地之后，发现它创造的价值要远大于其成本。百度智能云和NVIDIA一直在创造这样的场景和机会，希望通过我们的联合深度优化，让整个企业模型训练和推理侧的效率提升，具有高性价比，对业务的促进产生强大推动力，进而在推动行业大模型落地过程中产生质变。

Q：大模型技术开始入局医药行业，两位认为大模型技术将会对药物研发起着怎样的帮助和作用？

张玮：新药研发其实是一个高投入、高风险、长周期的行业。传统来看新药研发有着双十困境，一款新药的研发至少是十年的投入、十亿美元的投资，也被称作长跑候选的业务。

随着AI，尤其是随着大模型浪潮的发展，可以看到面向新药研发环节中，大模型有非常多的用武之地。拆开整个药物研发环节可发现，AI技术已经遍地生根。如果大模型技术加持医药研发行业，那将会有更多基于大模型技术的行业模型涌现出来。

目前蛋白质结构预测和分子的筛选已有相应大模型的应用，且随着大模型技术不断地加深采用，对整个医药行业起到的作用是毋庸置疑的。无论是原先的双十困境，或是对某一些关键环节、关键领域的优化均能起到重要的帮助。

此外目前的大模型对于知识管理、领域知识的学习能力很强，与之前相比有很大的进步，它在面对复杂的know-how中，面对有众多行业知识、领域知识的生物医药行业中，能在各种各样的知识管理场景里创造价值。

刘川：如张总所言，在药物研发分子筛选过程、早期的匹配过程、预测结构中都有大模型领域的用武之地，这中间需要一些跨界的联合，医药科学家、化学科学家往AI走一步，AI科学家向医药专家所处的领域跨一步，有效碰撞和融合。

在这个领域中要大胆假设、小心求证。证明技术有效需要做很多基础工作，尤其在物理化学层面上，其底层是AIforScience的范畴。从上层的业务表现和底层的分子动力学、化学等领域入手，证明AI的新方法可以替代传统方式，打通从技术底座到商务变现的整个链条，做赛道上的创新。

Q：百度智能云与NVIDIA的合作如何助力大模型在药物研发上的应用落地？

刘川：首先NVIDIA在大模型领域中有着通用能力，服务例如NVIDIA有NeMoFramework，它是大模型训练的一个框架，可以提高整个训练的算力利用率，承载了不同大模型的开源和各个赛道的基础能力。

其次NVIDIA有一款面向生物制药领域的“服务”——BioNeMo，主要基于Transformer结构做蛋白质的预测和结构，包括性质预测、docking、embedding，这些可理解为是NVIDIA做的探索和验证。

那么NVIDIA跟百度智能云怎么合作？我们是利用同样的技术栈，联合将客户场景应用于大模型去做验证，分析在哪些环节中大模型可以提供有效的帮助，让其研究或预测变得更快、更准。我们已经跟百度的一些头部客户合作，在行业中是头部玩家，这是开端；后续NVIDIA跟百度智能云一起将形成客户、云和AI技术联合在一起的长效合作机制，从一个点进行突破，产生收益，再从点到面，做出成果慢慢影响整个行业。把整个Pipeline的业务过程优化到最优，将瓶颈打通，我们一直用这样的方法论支持客户，包括跟百度智能云的深入合作，助力云上的客户业务效果最优。

张玮：百度智能云本身可以提供几个层面的方案给到有不同需求和不同阶段的客户。上述已提到百度智能云本身有非常好的AI计算基础算力平台，面向有能力结合自己的数据、需要去做自研行业大模型训练的客户，我们会提供高性价比、高效率的算力服务。这种算力服务本身也会基于大模型训练的特点，从而赋予相应的优化；同时会针对行业模型自身应用场景的单体环节做优化，尤其是生物医药领域。

在生物医药行业大模型里，数据闭环非常重要，它甚至可以被称为是行业大模型中最核心的竞争力之一；面对数据闭环在生物医药领域里的使用，尤其是干湿实验的数据闭环中，如何才能把闭环的效率提升到最佳？应该采用什么样的算力方案去帮助AI训练的行业模型实现更好的数据闭环？这是AI算力的基础服务本身要去替客户解决的问题，把这样的问题解决好，帮助行业模型快速落地，为新药研发提供更多的服务与支持，这是第一类。

另一类是基于百度在生物计算领域当中的投入和研究而训练并持续发布出的系列行业大模型，如百度自主研发的生物计算大模型——PaddleHelix。它们能面向如蛋白质的结构预测、化合物的通用表征等类似于生物医药研发领域的各个场景；包括百度今年发布的mRNA序列设计工具等在内的系列算法侧工具，都能以SaaS服务的方式提供，帮助新药研发领域的客户研发及提升效率。

结合以上两类场景，百度大胆开拓融合方案，通过将自身产品和能力的组合，尤其是结合大模型的组合，与NVIDIA在单个pipeline业务的环节上做端到端的优化，不仅助力单个企业，而是帮助整个行业提升效率。

Q：10月17日，百度智能云全面升级了“云智一体”战略，请张总为我们解读一下这个战略。

张玮：10月17日，云智一体的战略内涵全面升级为“云智一体，深入产业，生态繁荣，AI普惠”。面向客户落地大模型的五类需求提供全站服务方案；人工智能与云计算的深度结合是企业快速落地AI原生应用的关键，这也是百度智能云始终倡导和践行的“云智一体”理念。

目前，百度集团所有应用和服务全部基于”云智一体“技术架构运行在百度智能云上。此外，面向客户落地大模型的五类需求，百度智能云基于千帆大模型平台打造的“大模型超级工厂”分别给出了最佳服务方案。

一直以来，云智一体的战略是百度智能云的核心战略，AI加上围绕AI应用和研发的算力底座，可称之为智能云。是百度面向千行百业提供技术方案、提供技术赋能的一个基础。从战略视角来看百度的智和云两者其实是相辅相成的，换而言之，云是为AI能力提供的基础，从云来看百度也是最懂AI训练、AI推理以及AI应用的算力基础设施。

故而，我们希望通过云智一体不同方案的输出给予客户更多的帮助；在云智一体战略之下，针对云和智的深度融合生成不同方向的解决方案，并通过最佳组合及优化，把方案惠及各个行业。

Q：百度智能云目前在大模型助力药物研发上的布局与成果能分享一下吗？

张玮：首先是文心大模型系列，以及基于行业场景的推出的行业大模型，且已在各个行业领域都有落地应用。

百度不断加大研发投入，10月17日，百度世界大会上正式发布了文心系列EB4.0。围绕4.0的百度AI原生产品都已做了相应的升级，例如搜索、文库、网盘、地图等面向C端用户的产品均已实现AI原生的升级。

从面向B端企业客户的角度来说，百度已助力了不同行业或领域的客户，尤其是在生物医药领域，已有头部企业基于百度智能云的解决方案做出自己的生物医药大模型，并已在新药研发当中开始投入使用。

Q：请刘总来总结一下NVIDIA在生命科学领域的先进技术和服务。

刘川：从我们跟百度智能云的深入合作来看，我们有完整的支持体系。

首先是最底层的加速库，例如cuBLAS、cuDNN等，也有针对大模型领域的TransformerEngine和TensorRT-LLM这样的工具，这些SDK帮助客户加速推理。在训练侧我们有NeMoFramework的训练框架，帮助云上客户提升训练的效率。

我们跟百度智能云在各个层面都有深入合作，在芯片层有合作加速训练与推理，在方案层跟千帆合作支持整个pipeline落地，在应用层面上述我们也提到NVIDIA有BioNeMo服务。BioNeMo基于Transformer、蛋白质的预测、性质预测、embedding、docking的端到端的服务，它包含了训练、推理、可视化的部分，NVIDIA希望通过这个服务能让更多行业的Player使用，放到云上以SaaS方式使用，让大家先感受到能力，或者帮助重度玩家重构技术栈。

但目前，第一我认为最核心的是需求。NVIDIA和百度很早就开始探索生科领域，其核心就是要找到需求。10月17日在百度世界大会上，我们听到基于AINative的能力来重构应用，重构带来新生产力与需求的碰撞，需要探索在新的生产力基础上，需求怎么与生产力结合？所以百度云用新的技术创造新的生产力，将新的生产力与业务需求结合创造价值，同时，也沉淀下来领先的基础架构，进而推动大模型应用的落地。

第二是NVIDIA与百度智能云基于底座的大模型训练中的深度合作，在NeMoFramework框架之上可以训各种不同的模型，跟百度与千帆一起，为更重度的一些玩家提供特定的支持。

第三是当模型出来之后需要业务落地、在商业环境验证，利用我们专业的加速技术，例如TensorRT-LLM、TransformerEngine等，帮助企业真正行业落地时，并把整个模型的效果做到比较高的吞吐。

最后是高频词——三方合作，联合将头部客户的顶尖模型优化到极致，让这个模型成为赛道里面最好的SOTA(state-of-the-art)模型，这样此模型在行业落地时才会产生推动力，不仅模型效果好，业务pipeline效果也最好。这就是NVIDIA与百度一起追求的目标，多年以来我们共同策划、共同发展，现在我们已有一些头部客户在做，希望可以将合作做到极致，让每个垂直领域的头部都能合作起来，一起把模型优化到最佳。