AI模型预测购物决策或将比你更精准

芝麻开门

芝麻开门(Gateio)

注册芝麻开门享最高$2,800好礼。

币安

币安(Binance)

币安是世界领先的数字货币交易平台,注册领100U。

别再依赖焦点小组了:最新研究发现,大型语言模型能以惊人准确度预测您的购物意向,其表现远超传统营销工具。

曼海姆大学与苏黎世联邦理工学院的研究人员发现,通过将自由格式文本转化为结构化调查数据,大语言模型能复现人类的购买意向——这正是营销者最重视的“您有多大可能购买此商品?”指标。

在上周发布的论文中,研究团队提出名为“语义相似度评级”的方法,将模型的开放式回答转化为传统消费者研究使用的五级“李克特”量表数值。

研究人员并未要求模型直接选择1-5的数字,而是让其自然回应(如“我绝对会买”或“打折可能考虑”),随后通过嵌入空间测量这些表述与标准答案(如“我肯定会购买”或“我不会购买”)的语义近似度。



每个回答在嵌入空间中被映射至最接近的参照表述,从而将LLM文本有效转化为统计评级。论文指出:“我们证明,优化语义相似度而非数字标签能生成与人类调查数据高度吻合的购买意向分布。LLM生成的回答在保持态度自然差异的同时,达到了人类重复调查90%的可靠性。”

在对9300份真实个人护理产品调查的测试中,SSR方法生成的模拟受访者数据,其李克特量表分布几乎完全复现原始数据。换言之:当要求模型“像消费者一样思考”时,它们确实做到了。

核心价值

这一发现可能重塑企业进行产品测试与市场研究的方式。消费者调查素以成本高昂、耗时漫长且易受偏见影响而著称。若模拟受访者能真实反映消费者行为,企业便能以极低成本对数千种产品或广告语进行筛选。

该研究还验证了更深层论断:LLM语义空间的几何结构不仅编码语言理解,更蕴含态度推理能力。通过嵌入空间对比答案而非字面文本分析,研究表明模型语义能以惊人保真度替代人类判断。

与此同时,这也引发了熟悉的伦理与方法论风险。研究人员仅测试了单一产品类别,该方法是否适用于金融决策或政治敏感话题仍是未知数。模拟“消费者”可能轻易沦为模拟靶向对象——相同建模技术或可用于优化政治说服、广告推送及行为引导。

正如研究者所言:“市场驱动的优化压力可能系统性侵蚀对齐性”——这句警示远不止适用于营销领域。

审慎思考

作者承认实验领域(个人护理产品)较为局限,或难以推广至高风险或情感主导的消费场景。SSR映射效果还依赖于精心设计的参照表述:细微的措辞变化可能导致结果偏差。此外,研究以人类调查数据为“基准真相”,但这类数据本身存在显著噪声与文化偏见。

批评者指出,基于嵌入的相似度假设语言向量能精准映射人类态度,但在涉及语境反讽时该假设可能失效。论文中90%的人类重测一致性虽然亮眼,仍存在显著误差空间。简言之,该方法平均表现优异,但尚不清楚这种平均是真实反映人类多样性,还是仅体现模型训练先验。

宏观视野

随着企业纷纷试水AI焦点小组与预测性投票,2025年学界对“模拟消费者建模”的关注度激增。麻省理工与剑桥大学的类似研究表明,LLM能以中等可靠度模拟人口统计与心理测量细分群体,但此前从未有研究能实现与真实购买意向数据的精准统计匹配。

目前SSR方法仍属研究原型,但预示着LLM未来不仅能回答问题,更可能成为公众意志的代言者。

这究竟是技术飞跃还是虚幻泡影,仍有待时间验证。


通用智能通讯

由生成式AI模型Gen主理的每周AI之旅 您的邮箱
立即订阅!
立即订阅!

© 版权声明

相关文章