30多款大模型同台竞技!在WAIC2023看尽国内AI主流大模型

探营2023世界人工智能大会,什么值得看

作者/ IT时报记者 沈毅斌

编辑/ 王昕 孙妍

2022年的世界人工智能大会,带领观众走进虚拟与现实相结合的世界——元宇宙。今年,ChatGPT火热得发烫,国内的百度、华为等产业巨头纷纷秀出文心一言、盘古等自研方案——大模型顺理成章成为2023年世界人工智能大会的“主角”。

7月5日,2023WAIC世界人工智能大会九大“镇馆之宝”揭晓,其中与大模型相关的就占据了“半壁江山”,此外还有30余款来自不同企业的大模型产品和技术悉数亮相,展示着大模型在千行百业的多元化应用。

商汤大模型能“说”善“画”

“假设你是一名记者,请写一篇关于本届人工智能大会的报道。”

“今天有幸来参加在上海举办的2023世界人工智能大会,这场盛会汇集了来自全球各地的科学家、企业家、政策制定者,共同探讨AI技术如何改变人们的未来……”这是《IT时报》记者探营时,与商汤自研的中文语言大模型——SenseChat之间的一段对话。

商汤现场工作人员介绍,本届WAIC上商汤展出的SenseChat商量2.0最新版本,是基于“商汤日日新SenseNova”大模型体系下开发的千亿级参数语言大模型。在知识准确性、上下文理解能力、逻辑判断能力、创作能力等方面都有大幅度提升,甚至在一些细分指标上已经超过GPT3.5,是目前表现最好的中国语言大模型之一。其同时支持简体中文、繁体中文、英文等多种语言交互,满足不同人群、不同场景的对话需求。

训练方面,商汤一方面利用大量企业垂直领域的数据进行训练,增加SenseChat商量知识的深度和广度;另一方面还上线了外接数据库的功能,使用时只需要将SenseChat商量与企业自己的数据库进行连接,便能自动检索和学习数据库里的知识,从而保证问答数据的准确性。

不仅如此,商汤展台内还展示了一幅摊开的巨型卷轴,画着一只穿着潮流、戴着墨镜的酷炫小熊,这是本届WAIC商汤带来的另一款大模型——AI绘画大模型秒画SenseMirage。

现场工作人员介绍,秒画SenseMirage 3.0的自研生成大模型参数已经提升至70亿量级,不仅能实现更清晰、更精致的细节刻画,生成速度也是秒级的。同时,在商汤的大语言模型的加持下,秒画SenseMirage能够更加准确地理解用户表述,只需输入几个简单的关键词汇,便能自动生成画作。例如输入潮流、卡通、熊、墨镜等词语,就能绘画出上文描述的炫酷小熊。

文心一格让人人都能“P图”

说到AI绘画大模型,不得不提的还有百度的文心一格。作为本届WAIC的“镇馆之宝”之一,文心一格与文心一言遥相呼应,经历了一年的迭代和更新,在质量与操作方面都有巨大进步。百度工作人员告诉《IT时报》记者,在画面质量上,文心一格经过3D渲染等步骤已经可以生成接近实景的图片,无论是人物面部表情,还是毛发等小细节,都能清晰准确进行刻画。

“P图”曾经是一项颇具门槛的图片修改美化技术,如今百度文心一格上线的涂抹功能,利用人工智能AI编辑功能,获取整幅画作的编辑信息后,对涂抹区域的内容进行与原画风格一致的补全编辑,并对补全画作连接处进行平滑处理,最终生成用户满意的理想画作,让人人都可以轻松掌握“P图”的技能。

值得一提的是,文心一格还推出首创性的图片风格叠加功能,使用时只需要上传两张不同风格的图片,通过调整参数或者输入文字要求,便能自动融合成一张图片,从而激发创作者灵感。

目前,文心一格注册用户超过600万,广告营销、内容制作、游戏原画等多个场景都有应用,用户通过微信小程序就能快速接入。

“式说”大模型重构企业级软件

生成图片、生成文案、生成攻略,在激烈的大模型赛道,第四范式走出了一条与众不同的道路,即将大模型技术聚焦企业软件领域,用生成式AI重构企业软件。因此,聚焦to B的多模态大模型产品“式说”应运而生。

第四范式现场工作人员向记者解释,“式说”不仅拥有输入输出多模态、知识库、Copilot(微软AI助手)、思维链等核心技术,同时具备内容可信、成本可控、数据安全等企业级优势。首先,“式说”保证企业能私有化部署大模型,所需算力成本相对可控;其次,“式说”生成的内容更加准确、可靠,并且在信息输出时定位原始出处,实现所有信息都“有据可查”;最后,在使用过程中,“式说”能做到知错能改,不断学习来更好地服务企业。

例如,一家零售门店的管理涉及员工管理、货品采购、库存控制、销售增长、处理客诉等多个环节,这些都需要在不同的系统上完成;而门店店长在管理时,就需要从各个系统中获取数据并进行筛选,甚至一些重要数据还需要找到专门数据团队才能获取,费时费力。

若是使用“式说”大模型后,零售门店店长可以直接通过对话形式,比如提问“查看商品销量、值班人员状态、违规操作”等关键语句,“式说”就能从不同系统中调用相关信息,让日常散落在多个系统的管理工作在一个对话框上直接完成,管理将因此变得更加便捷。

在司法领域,司法人员不仅要掌握相关领域的法律法规、司法解释,还要将法律知识灵活运用在法律分析、法律检索、法律写作、法律论证等具体实践上。基于“式说”生成式AI打造的司法小助手,能在繁多的法律文件中快速定位并检索资料,还可以进行相应的法律文书书写、校对工作。此外,针对常见案件、速裁案件,可以协助提取审判的关键要素等,让司法人员的工作更高效。

据悉,自“式说”发布以来,已经在金融、零售、医疗、物流、运营商、房地产等多个领域的上百家企业落地,积累了数十类国内最早的AIGC产业应用,成为行业中不同岗位的得力助手。

华为昇腾AI孵化原生大模型

去年WAIC,华为昇腾AI带着全球首个三模态模型“紫东太初”亮相,成为“镇馆之宝”之一。今年,华为昇腾AI再次凭借“大模型超级工厂”夺得“镇馆之宝”一席之位。与去年不同的是,“大模型超级工厂”并不是单一的大模型,而是在数据&模型准备、算力准备&模型训练、模型部署上线&集成等阶段全流程使能大模型的开发与应用创新。

华为现场工作人员告诉《IT时报》记者,昇腾已原生孵化和适配30多个大模型,成为 AI 大模型创新首选,其中,国内原生大模型有一半基于昇腾AI孵化。

为了能更好地展现昇腾AI在大模型开发与应用创新的作用,华为展台分别从软件和硬件两方面进行展示。硬件方面,大模型对算力需求的增长速度远远高于硬件算力的增长速度,因此,新建大模型就需要有一个AI集群,才可以满足大模型的训练需求。但AI集群建设又面临着算力规模、液冷、跨域协同和可靠性4大关键技术挑战,Atlas 900 PoD A2集群基础单元应运而生。

这台“大家伙”拥有黑色的金属外壳,长方形的体型,看起来平平无奇,实际却暗藏玄机。现场工作人员介绍,Atlas 900 PoD A2在算力规模上支持万卡集群,这就意味着即便是GPT-4级别的算力需求也能很好适配;其次,Atlas 900 PoD A2采用液冷、互联、供电三总线设计,交付周期由两周缩短为3天。数据显示,Atlas 900 PoD A2的PUE(数据中心能源效率指标)值低于1.15,在绿色减排上表现出色。

软件同样也是训练大模型的关键环节,“大模型超级工厂”设立了可诊断、可衡量、可恢复的多级可靠机制,若是其中某一节点发生故障,系统会第一时间记录下来,同时将故障节点隔离,并调动其他节点资源继续训练,以此来保证训练的稳定性。

“相比业界其他集群,我们能实现10倍级提升集群系统的稳定性。”华为现场工作人员说。

排版/ 季嘉颖

图片/ IT时报

来源/《IT时报》公众号vittimes

E N D

请加「星标」不错过我们】】】