30多款大模型同台竞技！在WAIC2023看尽国内AI主流大模型

szb.snjbs.com | 2023-07-07 06:53 |发布：神农科技

探营2023世界人工智能大会，什么值得看

作者／ IT时报记者沈毅斌

编辑／王昕 孙妍

2022年的世界人工智能大会，带领观众走进虚拟与现实相结合的世界——元宇宙。今年，ChatGPT火热得发烫，国内的百度、华为等产业巨头纷纷秀出文心一言、盘古等自研方案——大模型顺理成章成为2023年世界人工智能大会的“主角”。

7月5日，2023WAIC世界人工智能大会九大“镇馆之宝”揭晓，其中与大模型相关的就占据了“半壁江山”，此外还有30余款来自不同企业的大模型产品和技术悉数亮相，展示着大模型在千行百业的多元化应用。

商汤大模型能“说”善“画”

“假设你是一名记者，请写一篇关于本届人工智能大会的报道。”

“今天有幸来参加在上海举办的2023世界人工智能大会，这场盛会汇集了来自全球各地的科学家、企业家、政策制定者，共同探讨AI技术如何改变人们的未来……”这是《IT时报》记者探营时，与商汤自研的中文语言大模型——SenseChat之间的一段对话。

商汤现场工作人员介绍，本届WAIC上商汤展出的SenseChat商量2.0最新版本，是基于“商汤日日新SenseNova”大模型体系下开发的千亿级参数语言大模型。在知识准确性、上下文理解能力、逻辑判断能力、创作能力等方面都有大幅度提升，甚至在一些细分指标上已经超过GPT3.5，是目前表现最好的中国语言大模型之一。其同时支持简体中文、繁体中文、英文等多种语言交互，满足不同人群、不同场景的对话需求。

训练方面，商汤一方面利用大量企业垂直领域的数据进行训练，增加SenseChat商量知识的深度和广度；另一方面还上线了外接数据库的功能，使用时只需要将SenseChat商量与企业自己的数据库进行连接，便能自动检索和学习数据库里的知识，从而保证问答数据的准确性。

不仅如此，商汤展台内还展示了一幅摊开的巨型卷轴，画着一只穿着潮流、戴着墨镜的酷炫小熊，这是本届WAIC商汤带来的另一款大模型——AI绘画大模型秒画SenseMirage。

现场工作人员介绍，秒画SenseMirage 3.0的自研生成大模型参数已经提升至70亿量级，不仅能实现更清晰、更精致的细节刻画，生成速度也是秒级的。同时，在商汤的大语言模型的加持下，秒画SenseMirage能够更加准确地理解用户表述，只需输入几个简单的关键词汇，便能自动生成画作。例如输入潮流、卡通、熊、墨镜等词语，就能绘画出上文描述的炫酷小熊。

文心一格让人人都能“P图”

说到AI绘画大模型，不得不提的还有百度的文心一格。作为本届WAIC的“镇馆之宝”之一，文心一格与文心一言遥相呼应，经历了一年的迭代和更新，在质量与操作方面都有巨大进步。百度工作人员告诉《IT时报》记者，在画面质量上，文心一格经过3D渲染等步骤已经可以生成接近实景的图片，无论是人物面部表情，还是毛发等小细节，都能清晰准确进行刻画。

“P图”曾经是一项颇具门槛的图片修改美化技术，如今百度文心一格上线的涂抹功能，利用人工智能AI编辑功能，获取整幅画作的编辑信息后，对涂抹区域的内容进行与原画风格一致的补全编辑，并对补全画作连接处进行平滑处理，最终生成用户满意的理想画作，让人人都可以轻松掌握“P图”的技能。

值得一提的是，文心一格还推出首创性的图片风格叠加功能，使用时只需要上传两张不同风格的图片，通过调整参数或者输入文字要求，便能自动融合成一张图片，从而激发创作者灵感。

目前，文心一格注册用户超过600万，广告营销、内容制作、游戏原画等多个场景都有应用，用户通过微信小程序就能快速接入。

“式说”大模型重构企业级软件

生成图片、生成文案、生成攻略，在激烈的大模型赛道，第四范式走出了一条与众不同的道路，即将大模型技术聚焦企业软件领域，用生成式AI重构企业软件。因此，聚焦to B的多模态大模型产品“式说”应运而生。

第四范式现场工作人员向记者解释，“式说”不仅拥有输入输出多模态、知识库、Copilot（微软AI助手）、思维链等核心技术，同时具备内容可信、成本可控、数据安全等企业级优势。首先，“式说”保证企业能私有化部署大模型，所需算力成本相对可控；其次，“式说”生成的内容更加准确、可靠，并且在信息输出时定位原始出处，实现所有信息都“有据可查”；最后，在使用过程中，“式说”能做到知错能改，不断学习来更好地服务企业。

例如，一家零售门店的管理涉及员工管理、货品采购、库存控制、销售增长、处理客诉等多个环节，这些都需要在不同的系统上完成；而门店店长在管理时，就需要从各个系统中获取数据并进行筛选，甚至一些重要数据还需要找到专门数据团队才能获取，费时费力。

若是使用“式说”大模型后，零售门店店长可以直接通过对话形式，比如提问“查看商品销量、值班人员状态、违规操作”等关键语句，“式说”就能从不同系统中调用相关信息，让日常散落在多个系统的管理工作在一个对话框上直接完成，管理将因此变得更加便捷。

在司法领域，司法人员不仅要掌握相关领域的法律法规、司法解释，还要将法律知识灵活运用在法律分析、法律检索、法律写作、法律论证等具体实践上。基于“式说”生成式AI打造的司法小助手，能在繁多的法律文件中快速定位并检索资料，还可以进行相应的法律文书书写、校对工作。此外，针对常见案件、速裁案件，可以协助提取审判的关键要素等，让司法人员的工作更高效。

据悉，自“式说”发布以来，已经在金融、零售、医疗、物流、运营商、房地产等多个领域的上百家企业落地，积累了数十类国内最早的AIGC产业应用，成为行业中不同岗位的得力助手。

华为昇腾AI孵化原生大模型

去年WAIC，华为昇腾AI带着全球首个三模态模型“紫东太初”亮相，成为“镇馆之宝”之一。今年，华为昇腾AI再次凭借“大模型超级工厂”夺得“镇馆之宝”一席之位。与去年不同的是，“大模型超级工厂”并不是单一的大模型，而是在数据＆模型准备、算力准备＆模型训练、模型部署上线＆集成等阶段全流程使能大模型的开发与应用创新。

华为现场工作人员告诉《IT时报》记者，昇腾已原生孵化和适配30多个大模型，成为 AI 大模型创新首选，其中，国内原生大模型有一半基于昇腾AI孵化。

为了能更好地展现昇腾AI在大模型开发与应用创新的作用，华为展台分别从软件和硬件两方面进行展示。硬件方面，大模型对算力需求的增长速度远远高于硬件算力的增长速度，因此，新建大模型就需要有一个AI集群，才可以满足大模型的训练需求。但AI集群建设又面临着算力规模、液冷、跨域协同和可靠性4大关键技术挑战，Atlas 900 PoD A2集群基础单元应运而生。

这台“大家伙”拥有黑色的金属外壳，长方形的体型，看起来平平无奇，实际却暗藏玄机。现场工作人员介绍，Atlas 900 PoD A2在算力规模上支持万卡集群，这就意味着即便是GPT-4级别的算力需求也能很好适配；其次，Atlas 900 PoD A2采用液冷、互联、供电三总线设计，交付周期由两周缩短为3天。数据显示，Atlas 900 PoD A2的PUE（数据中心能源效率指标）值低于1.15，在绿色减排上表现出色。

软件同样也是训练大模型的关键环节，“大模型超级工厂”设立了可诊断、可衡量、可恢复的多级可靠机制，若是其中某一节点发生故障，系统会第一时间记录下来，同时将故障节点隔离，并调动其他节点资源继续训练，以此来保证训练的稳定性。

“相比业界其他集群，我们能实现10倍级提升集群系统的稳定性。”华为现场工作人员说。

排版／季嘉颖

图片／ IT时报

来源／《IT时报》公众号vittimes

E N D

请加「星标」不错过我们】】】

30多款大模型同台竞技！在WAIC2023看尽国内AI主流大模型

最新报道

微媒专栏

阅读排行

滚动报道