查看原文
其他

大模型的下一步:要高精尖,更要接地气

Synced 机器之心 2022-12-22

机器之心原创

作者:杜伟
大模型落地,如何以终为始紧跟业务需求?


当下,AI 领域最热门的技术非大模型莫属。提到大模型,你也许会想到高参数、强算力、各种国际级的技术奖项和竞赛佳绩…… 让大家认为数据上的「大」和「强」,就是衡量大模型好坏的标准。

诚然,大模型的竞争力建立在「大」和「强」的基础上,但对于应用端来说,需要将大数据的能力真正落实到需求上,实现实实在在的转化,才是展现大模型真正实力的关键一环。因此,如何将大模型与产业化应用无缝连接,研发出适合具体业务场景的行业化大模型,已成为业界纷纷发力的方向。可是,要实现这个目标,却并不简单。

大模型应用落地,难点在何处?

作为当前 AI 领域的前沿技术,各类大模型在促进产业智能化升级、提升业务流程效率与水平等方面都具有领先性;但到了实际应用环节,依然面临很多难题,如技术能力与业务目标不适配、技术无法及时响应业务需求、基建承载能力弱等。

以往,前沿技术都是先做好应用模块,再在具体场景下做 “本地化适配”。而今时今日,技术要想在业务中得以落地,无论是数据收集,还是算法架构,都需要更加前置地考虑如何贴合真实业务需求、如何达成广告主目标,才能将这些思考进行充分表达。因此,为了让大模型更好地落地,技术团队首先要充分了解业务特性或目标,从而结合实际业务强化技术能力持续磨合与进化,做到一切以为业务服务为目标。

此外,谈到业务场景,尤其是广告业务的场景,基于不同行业、不同业务类型,他们的诉求也存在不小的差异。大模型需要实时掌握这些需求,并对此作出快速的响应。这个道理固然简单,但要落实到技术层面,却需要一个相当漫长、复杂的调试和部署周期,往往导致技术迭代落后于业务变化。因此,如何提升大模型的灵活性与敏捷性,能够适配业务需求的调整和变化,成为了建模的重要抓手之一。

总的来说,解决大模型落地难题的关键在于跨越大模型能力与真实业务场景之间的「鸿沟」。如果能以业务目标及动态需求为导向,并满足具体业务运行所需的各项能力,大模型才有可能真正实现落地

要真正满足以上的要求,大模型就需要拥有强大的学习能力,能够通过超大规模的样本训练,锻炼出快速的理解和良好的推理能力。这意味着,大模型的稳定运行需要强大基建支持。然而现实往往是大模型技术到位了,基建没有跟上,多数系统承载不下,大模型只能停留在实验室层面。因此,建设支撑大模型在线训练、推理与部署的计算平台至关重要。

抓住广告业务痛点,腾讯实现大模型又好又快落地

在各家纷纷推广自家大模型的时候,我们注意到了腾讯广告的独特身影。此前,我们就曾在《大厂的广告系统升级,怎能少了大模型的身影》一文中介绍过腾讯广告的混元 AI 大模型与广告大模型,见证了它们强大的技术能力。而我们最近了解到,这两个模型已在具体广告场景得到了应用,真实服务广告主们。

大模型落地困难重重,腾讯广告如何克服以上难点,将前沿技术融入广告业务?今天我们将从业务痛点出发,逐步拆解腾讯广告以终为始的 “技术提效” 思路。

买化妆品的一定是女性?大模型向 “交易” 进化,找到真正对的人! 

互联网广告业务场景本来就具有复杂多变的特点,可谓是大模型应用价值的最佳试金石。随着企业产品的推广竞争越来越激烈,内容营销早已经不止于简单的性能介绍,而需要从人群、地域、话题、商品特性等等层面找到相互融合之处,才能有效吸引消费者的关注及达成转化,从而真正帮助广告主实现生意增长。然而,当下互联网广告场景的参数体量已经非常大,广告业务也正在往短平快、多触点、全域链接的方向迅速发展,这都对广告系统的快速挖掘、灵活匹配提出了更高的要求。此时,广告系统的运算能力就发挥不可或缺的作用。

针对这些业务痛点,腾讯广告打造混元 AI 大模型与广告大模型,全面提升广告系统的理解能力与运算能力,从而帮助广告主实现生意的高效增长。

作为在中文语言理解测评基准 CLUE、多模态理解领域国际权威榜单 VCR 以及 5 大国际跨模态检索数据集榜单(如 MSR-VTT 等)上登顶的业界领先大模型,混元 AI 大模型具备强大的多模态理解能力,可将文字、图像和视频作为一个整体来理解,将广告更精准地推荐给合适的人群,在广告投放过程中实现更快速的起量。

对于广告主而言,在投放中 “起量” 非常重要。当点击率、转化率在短时间内达成了广告主预设的目标,就意味着起量了。混元 AI 大模型的多模态理解能够快速解析出广告素材中的商品名称、规格等丰富的信息,并据此推荐给更可能对此广告感兴趣的人群

我们以润百颜为例,以往这类美妆护肤类广告,都是由优化师们基于品牌对于目标受众的理解,主动选择人群标签进行广告投放。以这个流程进行投放,广告系统并不需要理解广告主真实的营销诉求。然而,如果假定润百颜的主要目标受众为 20-40 岁的女性,那么会购买此产品送给女性朋友的男性就会在投放过程中被排除在外。 

为此,腾讯广告通过与广告主合作引入行业专业知识,进一步细化商品特征,构建全面的美妆行业知识图谱,收集并绑定相同产品的不同素材进行投放。结果显示,当新素材出现时,同产品其他广告积累的数据帮助系统更快更稳健地完成起量。同时,通过打通单一广告主账户下的所有账号实现一体化商品管理,从统一视角聚合商品投放及投后数据的管理,降低整体空耗率。

从更好地理解商品开始,帮商品更快地匹配到对应的消费者,广告大模型强大的运算能力就是提升推荐效率的关键。从参数来看,广告精排大模型的单模型推理参数达到千亿级别,序列化后大小可达数百 GB,浮点数计算量最高每秒超过 10 亿次,在行业位于先进水平。

在广告大模型运算能力的支持下,腾讯广告实现了以系统为主导的全域搜索,能够更快地搜索并挖掘用户与商品的潜在关系,大大提升人货匹配效率,找到更多高成交人群。

可以说,两大模型的加持让广告系统更懂货、更懂广告主生意逻辑、更快找到潜在受众。事实也证明,这套方法行之有效,润百颜的转化起量率提升了 25.43%,空耗率降低了 43.68%,高信息度商品下单 ROI 提升了 5%。


大模型 + 强算力,支持定制模型 7 天上线,快速响应广告主诉求

通过混元 AI 大模型获得了更丰富的特征以后,就可以联动广告大模型进行更准确、更高效的建模了。不仅如此,广告大模型本身也可作为一个通用底座,构建更多灵活的定制模型,适配各种应用场景。这就为满足不同广告主的差异化、精细化需求打下了基础。

在处理广告主实际广告业务过程中,腾讯广告采用了大模型 + 定制模型的技术思路,一方面充分发挥广告大模型的强运算能力,提升数据运算的精度、维度与速度;另一方面依托广告大模型快速搭建业务相关的定制化模型,满足多样化需求,做到有的放矢,帮助广告主更快地完成投放目标。

对于游戏、网服等线上服务类广告主而言,传统投放平台上能够提供的推广目标往往无法满足他们非常精细的投放诉求。以某个网服广告主为例,他们对出价的差异化要求精细到了「通关 3 次」和「通关 5 次」。此外,流量规则与转化路径的区别也使得每个行业、每个广告主要求用户完成不同的转化行为。以游戏行业为例,超休闲和中重度游戏对用户行为要求不同,前者要求用户看完一次激励视频即完成转化,后者则需要用户成功下载、上手玩甚至付费才算完成转化。

为了更快更灵活地响应广告主的差异化诉求,跟上业务变化脚步,腾讯广告选择在大模型上建定制模型,与该网服广告主共同定义促成生意增长的用户关键行为和关键目标,并以「关键行为」为优化目标进行独立建模。

但是,从沟通建模到跑通行业定制模型,难度很高,所需时间也颇长。在广告大模型运算能力的加持下,腾讯广告得以实现快速建模,将模型上线时间从业内普遍的两个月缩短至了 7 天,并在 30 天内完成优化迭代,同时做到及时、准确响应广告主的具体业务需求。

有了大模型助力,网服广告主抢占了流量先机,最终买量 ROI 提升了 20%,平均出价和 eCPM 提升了 50%。


修炼内功 —— 太极机器学习平台提供强大基建

亿级用户、海量广告内容对广告平台的承载和计算能力提出了更高要求,腾讯自研的太极机器学习平台支持 10TB 级模型训练、TB 级模型推理和分钟级模型发布上线,为两大模型在业务场景实现 7×24 小时顺利运行提供了强大基建,保障了混元 AI 大模型、广告大模型的快速、稳定运行。

目前,腾讯广告系统已完成了全面升级(如下图)。底层数据生态(营销数据和经营数据)提供了系统持续运行所需的「源动力」,而一大平台、两大模型强化了系统的理解与运算能力,从而高效达成广告主最关心的三大效果指标 “起量、成本和稳定性”。


升级后的腾讯广告系统为更好地满足广告主诉求、持续优化用户体验构建了坚实可靠的技术底座,在广告业务场景中真正实现了技术提效。

结语

无论是利用混元 AI 大模型强化理解能力,还是通过广告大模型提升运算能力,腾讯广告读懂了如何将大模型落地到业务场景的关键,并摸索出了一套独特的打法。这为业界其他大模型玩家提供了应用参考范式,即始终围绕业务痛点做深文章,充分释放已有能力,并通过积极变招满足广告主变化的真实诉求。

两大模型的落地践行了腾讯广告 “技术提效” 理念。未来,腾讯广告将继续强调技术落地的重要性,从技术的角度理解业务,从业务的角度审视技术,让技术演进推动业务增长,为广告主创造更多的价值。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存