枫清科技高雪峰:为大模型消除“幻觉”,推动企业智能化升级
9月13日,在2024中国国际服务贸易交易会期间,由工业和信息化部新闻宣传中心和中国信息通信研究院联合承办的“大模型应用创新论坛”在北京首钢园举办,与会嘉宾共同探讨大模型技术如何赋能千行百业,提升产业技术水平。
枫清科技创始人兼CEO高雪峰受邀出席,并发表题为《AI+行业落地新范式:知识引擎与大模型双轮驱动企业智能化升级》的分享,阐述他对以大模型技术为代表的人工智能技术赋能产业转型升级的深刻见解。
枫清科技创始人兼CEO高雪峰
从C到B,如何消除大模型“幻觉”?
“一本正经地胡说八道”是很多人对AIGC的第一印象,这其实是一种“幻觉”现象。语言模型的幻觉,指的是模型生成了不符合事实或毫无根据的信息。通俗点说,就是现在的AI都有概率“说胡话”。
对于企业应用场景而言,AI“说胡话”意味着不可控的风险。人们尝试使用向量数据库来聚合数据,但很快发现这种方法在企业场景落地时仍无法解决模型幻觉、可解释性和逻辑推理能力不足的问题。
那么,该如何破解大模型的“幻觉”问题?高雪峰从机器学习技术演进路线讲起,他表示,在机器学习领域,长期以来存在着两种主要的架构理念之争:Model-Centric与 Data-Centric(以数据为中心),争论的焦点在于:为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。
在他看来,在行业场景实践尝试当中,Data-Centric的理念路径更加有效地解决了企业当前智能化场景落地所遇到的各种困难。“为了在企业场景中实现更好的智能化效果,枫清科技坚定地选择了Data Centric LLM Landing 架构,让不同的模型能力服务于企业本地经过组织的数据和知识。”
在AI的发展历史中,概率方法和符号逻辑推理一直是交替发展的两种主要方法。当前,联结主义的巅峰——AIGC技术在企业端场景落地和迈向决策智能的过程中,同样遇到了诸多技术挑战,诸如模型幻觉、可解释性差、推理能力弱、数据安全可控性以及时效性等问题,这些问题恰恰是符号逻辑推理技术所能够解决的。
“仅有生成式智能是不够的。为了在实际应用场景中提供真正的帮助,我们必须辅以强大的推理能力和可解释性机制,并尽可能解决大模型可能出现的幻觉问题。”高雪峰说。
为了应对这些挑战,枫清科技在这一领域进行了多项业界领先的创新。比如,采用智能化的方法将企业的多模态数据转化为知识,并构建了企业元数据的导航地图;通过图结构与向量融合的方式,实现了数据的原生存储和多模态计算;整合多种不同的大模型,包括那些能够解决特定场景问题的传统的小模型或机器学习模型,以应对实际的场景化问题。
重塑行业,AI如何释放新动能?
在迈向人工智能赋能行业的路径上,平台建设是非常重要的基础。这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?
高雪峰认为,实现行业大模型的智能化发展需要经历三个关键阶段:单点应用的AI创新、知识引擎驱动的行业AI智能应用平台,以及融合精准知识与大模型泛化知识的行业大模型阶段。
他介绍,枫清科技利用其核心技术,助力众多头部央企和国企客户,通过利用本地数据,在不到两周的时间内快速验证产品在业务价值场景中的巨大潜力,其“一体两翼”的产品矩阵,可以为客户的AI+平台建设奠定坚实的基础,连接多样化的模型能力,以应对各种细分场景。
当前,人工智能技术不再只是工具或平台,而成为一种全新的思维和商业模式。高雪峰介绍,“自2021年枫清科技成立以来,我们的目标就是构建未来通用人工智能时代的核心基础设施。我们致力于利用数据驱动的AI技术架构,帮助企业级客户实现全面的智能化升级。”
“通过知识引擎与大模型双轮驱动的智能体平台,我们将这些核心能力浓缩,赋能企业的决策和工作流程。”高雪峰介绍,通过智能体平台及其上的原生知识库能力,赋能丰富的企业级场景,从而在平台上丰富更多的行业智能体工具组件。通过平台的能力,可以很好地整合企业自身的数据资源与企业模型中的数据资源,并产生增值价值。
他认为,“越来越多的行业领导者开始在“人工智能+领域”重新审视行业布局和工作模式,人工智能重塑各行各业的时代已经到来。”需要从人工智能的角度审视每一个行业,搭建新的生态,重塑发展模式。
“正如互联网+时代的格言所言,未来的竞争并非来自互联网本身,而是那些将互联网+融入每个角落的竞争对手。同样,在人工智能+的时代,真正的竞争者将是那些能够将智能化技术融入行业每个场景中的企业。”高雪峰说。