大模型“发枪”,这些问题不解决应用就没法“冲刺”|宁可直说

在WAIC2023的展馆现场, 30多个大模型在每一家的展台上都能完美呈现,仅仅根据呈现的任务处理能力,很难分辨它们本质的不同。

“也不需要把一些过程想得太复杂,当你选择继续生成或者重新生成,这本身就是对大模型的一种反馈,告诉它‘这次你做得可能不够好,要继续调整’。”一位展台人员这样向观展者介绍。

大模型已然“发枪”,应用开发商有人选择“拿锤找钉”,也有人加速产品迭代,但在商业化路径上还很难翻出花样。应用为何没法“冲刺”?

离不开高质量数据训练

在大模型的应用中,需要应用开发商和购买应用的企业用户关系绑定更为紧密,因为大模型的训练需要企业用户特有的数据才能在模型调优时更精准。先做出大模型新产品demo(模型)再去寻找客户,这个“拿锤找钉”不失为一个好办法。

武汉百智诚远推出的文书精灵主打可智能生成裁判文书,通过在紫东太初大模型上基于华为昇思AI框架训练了6个月,已经可以形成不错的质量文本,但也不是没有问题。公司发现,虽然案件当事人双方提供的起诉状和案件卷宗有着相对固定的格式,内容数据质量相对较高,“因为双方当事人观点相左,所以还得由人最后确认文本逻辑是否正确”,也因为如此,工作人员表示当下“还没有开始收费,现在需要更多的数据来训练”。这背后的问题是数据库的建设和使用。

“我们认为在整个数据产业链中,还需要各种类型的数据库才能真正把这个大模型用起来。” 星环科技创始人兼CEO 孙元浩说。大模型输入的是自然语言,过去已有很多结构化的工作把自然语言变成计算机可以识别的结构化的信息,但现在要变成大模型可以理解的语言,如果要推理,就要把它向量化。因此想要辅助大模型理解数据,还需要有新一批工具的出现。

正如腾讯云数据库副总经理罗云不久前在发布AI原生向量数据库时谈道,向量数据库是企业数据和大模型之间的桥梁,能够弥补大模型在时间和空间上的限制。

找准客户需求

技术应用终需迎接商业化挑战,这需要尽快地得到购买企业服务的用户认可。

一些大模型产品是应用开发商基于已有产品的迭代升级。以前,语言智能科技企业蜜度推出负责校对服务的是AI工具“校对通”,在大语言模型(LLM)的加持下,新推出的蜜度文修运用高质量数据学习多种特色子任务,能够在一个模型里同时实现多个校对任务,完善了过去难以解决的易混词细微语义辨析,并在领域公认的数据集里表现优异。在SIGHAN数据集(关注拼写错误)的几项测试中,蜜度文修的F1值均为60-70%,以ChatGPT为代表的通用大模型则为30-50%,体现出垂直领域大模型的优势。

“用于训练数据的质量和机器所做的任务类型对模型最终输出的能力而言至关重要。我倾向于认为,工具的最大商业价值,一定在于是否能有效解决客户的问题。在这个过程中,我们不断收集到反馈和需求,这就促使我们一定要跟上主流技术路线来提升和完善能力。”上海蜜度智能校对事业部总经理张晓娟说。

有业内人士表示,如果不是ChatGPT在面向C端时火了,可能不会有人关注到这个更有可能在to B领域掘金的领域。不过正如张晓娟提到“商业化的路径倒没有本质性的变更”,打动客户的是高效解决问题,大模型应用的变现关键点也正在于此。

审慎判断投入力度

大模型作为新兴的MaaS(模型即服务)层,吸引了应用开发者的关注,如何评估投入?

微盟集团在今年5月正式发布基于大模型的AI应用型产品WAI,上线了包括“话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案”等在内25个实际应用场景,在618购物节期间就迎来了第一波“实战反馈”。微盟数据显示,以SaaS融合形态为例,从采用率来看,商品描述占比最高,达到40%;种草笔记正文达36%,而商家最为关注的口播稿的直接采用率也达到22%。这意味着,在微盟WAI为商家生成的内容中,平均2-3条就有1条内容可以被商家直接采用。

有了这样的结果,除了成为百度文心一言生态合作伙伴,618刚过微盟马上又与腾讯云启动了行业大模型的共建合作。“这次的AI确实和以往不一样,所以我们会密切关注,包括最开始内测的时候,实际上我们还是想铺开的,看情况决定加大投入。从目前效果来看,我们能够走到今天已经很不容易了。我们理念也很清晰,也证明了我们不只是想讲故事,而是踏踏实实做事。” 微盟首席运营官尹世明说。微盟表示,正积极研究GPT、Bard等,并尝试在部分领域的开源自研。

可以看到,现在大模型应用在垂直领域的发展机会不少。然而,“是不是所有事情都用大模型?不尽然,因为真正动用大模型一定要考虑到成本和效益之间的平衡。通用大模型实现商业变现程度到底怎么样,无论从国际还是国内,现在看不出来。”毕马威中国数字化赋能主管合伙人张庆杰提醒。

想要应用加速“冲刺”,还需要一段时间。

举报/反馈