机器之心原创
作者:蛋酱
今年 7 月,团队一份《全球数字经济白皮书 (2024)》统计显示,竞逐技全球目前已有 1300 多个基础大模型,产业场金出圈美国的真题数量最多,中国紧随其后排在第二。融科
这一数字对比说明,赛火在大模型这张「牌桌」上,模型中美是团队最具实力的两个玩家。曾经,竞逐技中国奋力追赶「OpenAI 们」,产业场金出圈两年之后我们可以看到,真题国产大模型在技术层面已抵达全球第一梯队。融科
而在这个过程中,赛火圈内玩家逐渐分化出两条路线:一派继续卷性能,模型一派专注搞应用。
国内的优势恰恰在于产业场景极其丰富,落地空间极其广阔。面向大模型的下半场战事,业界普遍认为,中国将在应用层展现出更强的后劲。
目前的核心问题是,如何让大模型技术尽快与更多真实的产业场景连接起来。
从何处入手?一是精准定位最需要大模型的产业场景,二是找到能解决这些真实场景问题的人才。
一场直面「产业真命题」的技术赛事
我们熟悉的大模型落地案例更多发生在对话、作画、视频等方向,但其价值远不止于此,大模型同样可以深刻改变城市发展、金融科技、生物医药、工业制造、科学研究等领域。
已连续举办两届的 AFAC 金融智能创新大赛,正在成为国内大模型人才竞逐金融产业真命题的赛场。
AFAC2024 金融智能创新大赛(以下简称 AFAC2024 大赛)以金融行业内真实案例及海量真实数据为牵引,鼓励参赛者直面金融产业真命题,探索最具挑战的创新模型和算法。在去年赛制的基础上,AFAC2024 大赛对比赛形式进一步升级,在「挑战组」之外新增了「初创组」和「企业组」,形成了涵盖算法赛、应用赛和创业赛的综合赛制架构。
蚂蚁集团副总裁、蚂蚁金融技术委员会主席王晓航表示,举办 AFAC2024 大赛的出发点之一就是集聚、培养优秀科技人才、开展高水平合作交流。
同时,大赛设立了丰厚的奖金池,并为选手提供了配套的技术支持,吸引了数千个极具潜力的大模型团队参与。值得注意的是,选手们可以基于蚂蚁开源的 agentUniverse 多智能体框架,对多智能体协作模型进行开发定制,轻松构建智能体应用,节省更多精力以专注于破解产业命题。
3 个月,4882 支队伍的技术探索,让这场比赛「卷」出了新的高度。中国最顶尖的一批大模型人才围绕金融场景下的众多产业真题,贡献了众多前沿解决方案。
「我们始终相信通过科技的力量可以带来更多微小而美好的变化,我们期待 AI 能让高质量的金融服务惠及每一个人,让更好的金融产品进入千家万户,成为人们生活中的一部分。」王晓航表示,「人工智能技术的作用和价值不应仅限于研究和模型能力,更应产生更大的应用价值,就像扫码支付一样能够进入千家万户,进入每一个行业。」
接下来,让我们来看看三个代表团队的技术创新故事。
什么样的金融研报生成应用
能从六百多支队伍脱颖而出?
「拥抱 AIGC」团队的三位成员有很多共同点:都就读于浙江大学软件工程专业,都是硕士二年级的研究生,甚至住在同一个寝室。除了研究方向不太相同:三人分别选择了计算机视觉、数据治理与大语言模型、时空数据作为主攻方向。
队长高天弘曾参加过首届 AFAC 大赛,关注到 AFAC2024 大赛启动之后,他决定拉上室友再挑战,尽管「金融智能」对于三人来说是有些陌生的领域。
一番深思熟虑之后,他们选择了「AIGC 金融多模态研究报告智能生成」这个赛题。团队需要将大模型技术和金融数据深度融合,提出有创新价值的金融研报生成智能体解决方案,并应用于实际场景。
大模型的通用能力在不断进化,但要想解决高水平问题,还要靠行业知识的进一步积累。纵观当前的各类对话式 AI 应用,生成真实、有用、高水平的研究报告仍然是一项极具挑战性的任务。特别是对于金融这种专业门槛极高的领域,数据时效性、长文本总结、图表生成等都是其中存在的挑战。
如何有效攻克?特别是在赛题发布后,留给团队完成方案设计的时间并不算多。
针对上述问题,他们设计了一个面向金融研报生成的多智能体协同框架。具体来说,这个框架包含三层:多元数据来源、金融研报生成智能体 Agent、多源大语言模型。
与传统的对话系统不同,协同的智能体具备任务规划和执行能力,能够在无需人类干预的情况下自动处理复杂问题,包括生成研报: