大模型如何更好赋能产业落地?闪马智能给出自己的答案

百模大战“激战正酣”。自今年年初以来,各家互联网大厂、创业公司、科研机构纷纷推出大模型。在未来,如何能够创造更加价值、与更多场景进行结合,将成为行业需要思考的问题。

7月8日上午,由上海闪马智能科技有限公司(下称“闪马智能”)、上海嘉丰车路数字技术有限公司(下称“嘉丰车路”)联合主办的“大模型生产与产业落地合作论坛”在上海世博展览馆举行。

在本次论坛上,专家学者、AI企业、投资机构等共聚一堂,围绕AGI时代背景展开技术趋势、模型生产、产业应用和算力需求展开充分讨论,共同促进大模型技术交流合作与可持续发展,推动产业数智化转型,助力科技强国建设。

闪马智能创始人、董事长兼CEO彭垚指出,在大模型时代,创新能力固然非常重要,但行业更要回归技术的本质,即企业要思考通过人工智能技术到底想解决什么样的社会问题。这样企业才能在竞争中获得一席之地。

据彭垚介绍称,闪马智能目前已经在智慧交通、智慧建造和智慧能源等工业场景下实现了落地,与此同时也在拓展新的业务场景,“例如通过人工智能来进行一些无人化的值守和黑灯工厂,也是我们探索的方向。”

AI大模型与算力资源

在大模型作为一种基础能力走向通用化的过程中,如何更好地与产业进行落地将是行业需要思考的问题。

国务院参事,发展中国家科学院院士,国际欧亚科学院院士,中国科学院虚拟经济与数据科学研究中心主任,中国科学院大数据挖掘与知识管理重点实验室主任石勇表示,大模型的本质就是比对加上猜测。

“大模型拥有一个庞大的数据库,可以进行快速地查询和比对。而猜测就是人工智能大模型能够找出不同参数之间的关系,把最相关的结果推断出来。”

与此同时,石勇也指出,由于大模型需要成千上万可调的参数以及成千上万个学习过的模型,这些东西都需要高速的算力支持。因此,如果没有算力平台,数字经济将“不复存在”。

除了围绕大模型的本质进行讨论外,与会专家也就“通用大模型如何在强垂直领域进行迁移和赋能”分享了自己的观点。

浙江大学求是特聘教授、浙江大学上海高等研究院常务副院长,浙江大学人工智能研究所所长吴飞认为,大模型的架构过于庞大,无法在终端的用户上进行实践,但是终端更靠用户更靠数据。因此垂直领域大模型相当于是轻量级高性能推引的模型,能够把它压缩得更极致。

“我们可以在终端上安装垂直领域大模型,再和云端动辄千亿、万亿的模型进行协同与进化。”吴飞表示,今后的基座模型会走向一个由通用到专用,由大到小,由云到端这样协同的方式,它能够既完成端侧的个性化对应的任务又能够辅助云端泛化能力的提升,达到一个端与端协同、大小模型不断进化的局面。

在彭垚看来,大模型存在的意义一定是需要应用到实际场景中,为人们解决问题,赋能社会发展。

因此,对于大模型本身,闪马智能也结合自身优势,基于视觉拓展做了感知大模型。“从未来的需求的角度考虑,人工智能是一种生产力。科技的本质还是应回归到解决问题上来,期待通过搭建AI生产力平台,真正服务‘AI+’发展、实现城市空间探索效能的飞跃。”彭垚说道。

但与此同时,彭垚也指出了当下行业内面临的挑战。

他表示,目前市场上的很多大模型都已经具备了很大数据量,甚至一些开源的模型已经诞生,因此数据的积累就已经花费了大量的资金和时间。

而在这一背景下,对很多应用型的企业来讲,更要思考怎么把模型在面向的领域进行数据标注以后,进行后续行业模型的开发。换言之,即把已有的学术资源变成业务落地性的模型。

“这里面对企业蕴含着两大挑战,第一是如何形成在行业数据方面的优势,这考验着企业对落地行业的理解,例如怎样将非常专业的处理数据标注出来;第二个挑战则是在算力投资之上,模型训练需要投入巨大的算力资源,这需要企业持续的资金支持。”

而闪马智能的优势在于对行业与场景的理解程度更加深刻。“我们并不是一个完全生成式的模型,而是一个最终的结果。它其实是一个理解式的模式。因此它具有一个非常明确的准确率。”

彭垚指出,大模型在进行产业化落地的过程中如果无法达到准确率的要求,就没有办法在交通这样一个高度工业化的场景内进行落地。“所以我们这种识别的模型精度要求会非常高,而深层次的模型更多注重的是人机互动。”

随着生成式人工智能的火热,“文生图”、“虚拟人”等新兴场景也迎来了快速的发展,在论坛现场,Unity中国CEO张俊波从Unity业务特性出发,分享了自己的观点。

他表示,当下在3D技术模型的生成方面业界存在很多思路,其中一种路径是通过可微分渲染技术,将3D模型降维渲染成2D图片,再通过2D的生成式AI模型作为监督,但他同时指出,这种模型生成质量还不够高,但是发展迅速。

另一种路径则是材质和贴图生成技术,张俊波指出,这一路线已经相对成熟,即通过描述生成贴图和材质,这一路径可以直接把2D的生成式AI模型应用到这方面来。而最重要的一个技术路径则是3D场景,但3D场景的生成过程比较复杂,“目前比较可行的方案是利用程序化的生成技术,前端通过AI模型将用户的文字描述或者草图、照片转化成程序化生成所需要的输入,比如说场景布局和组合规则等这些比较适合于大模型去生成的简单数据格式,这种数据格式通过程序化生成工具的解析后,可以像搭积木一样把已有的资产拼成更完整的场景。”

沐曦创始人、董事长兼CEO陈维良则从GPU底层算力的角度为未来大模型的产业落地提出了建议。

他表示,模型的训练、实施都需要巨大的算力,但当下算力的供给和需求之间存在着非常大的矛盾。而这一矛盾的解决路径就在于要进一步压低AI的算力成本。

“高效的算力正在支撑着生成式人工智能的发展,因此算力是一个基本需求,而如果我们不能降低AI的算力成本,实际上会限制它的推广程度。例如以前有很多人用不起大型机,我们也没有办法用来做计算,但在PC和移动设备出现以后。算力在向着更加普惠化的方向发展。”

陈维良指出,降低算力成本、提高GPU利用率有着多种路径,这包括GPU结构的优化、让通用GPU支撑大模型内的算子融合,提高集成效率以及GPU的软硬件协同等。

走向开放的AI大模型生态

在论坛现场,中科闪马智能有限公司正式揭牌,由闪马智能和嘉丰车路共建的联合创新实验室也正式成立。

据了解,“中科闪马”由闪马智能与北京国科智算科技有限公司、北京国科未来科技有限公司联合成立,意在推广ATOM新一代异构人工智能计算平台和DataOcean新一代存储系统,致力于打造自主可控、软硬一体的人工智能计算与存贮设备,为大模型的训练与实战提供可靠的计算平台。

中国科学院虚拟经济与数据科学研究中心特聘研究员张影飞表示:“中科闪马智能有限公司具有三大优势:第一,强强联合、资源整合;第二,技术融合、拓展应用;第三,聚力发力、突破难点。期待与闪马智能共同推动自主可控的国产技术发展与创新。”

而在中国科学院院士何积丰看来,开放的生态模式可以让行业收集更多的数据、产生更大的模型,进而缔造一个更加强大的算力平台。“开放平台有两方面意义,一方面我们应该把更多平台放在开源环境里,让大家使用、让大家体验,让大家来提高这个平台质量。另一方面我们希望建设一个好的行业生态,让大企业能够带动中小企业充分运用好人工智能技术,赋能他们技术的发展。”

闪马智能与嘉丰车路共建的联合创新实验室将结合双方优势,在车路协同、智慧停车、高可信网络安全技术、ATOM AI生产力平台和面向大语言模型训练平台应用领域展开全面战略合作与联合创新。

为了更好地迈向AGI时代,闪马智能给出了自己的答案。本次论坛上,闪马智能介绍了ATOM AI生产力平台。

与此同时,为了解决目前行业内高性能算力资源稀缺的挑战,进一步科学有效地流通和利用算力资源,闪马智能ATOM AI生产力平台也迎来了发布。

据闪马智能方面介绍,ATOM AI生产力平台,构建了从标注到训练到测试到落地的全链路自动生产体系,支持跨云跨集群灵活调度,基于DataExpress 数据多级缓存与数据pipeline,可支撑千卡级大模型训练及各类场景微调模型的稳定运行,实现模型快速生产、迭代与验证的一站式管理,保障技术成果积累和数据资产沉淀。

ATOM AI生产力平台具有一站式、易使用、高性能、规模化和易扩展等亮点,其在整合功能、简化流程以及跨云跨集群统一调度等方面的优势,将进一步降低用户使用和管理门槛,实现资源化整为零、有效复用,并灵活适应下游多场景需求,实现“向上助力应用方”、“向下赋能资源方”,可在智慧交管、智慧高速、智慧轨交、智慧建造、智慧电站和扬尘治理等业务场景中落地应用。