GPT-4能否在2008年发现爱彼迎,或在2012年识别Figma——早于专业投资者?
牛津大学与Vela Research的研究人员最新论文指出,大型语言模型筛选成功企业的能力已超越多数早期投资者。在这个以模式匹配和人脉推荐著称的领域,AI无需知晓创始人姓名即可提前发掘潜力项目,或将彻底改变行业规则。
若GPT-4o等模型能小幅提升命中率,它们必将成为所有投资机构的必备工具,甚至可能让初创企业投资变得更注重实际价值。
<span data-mce-type=”bookmark” style=”display:inline-block;width:0px;overflow:hidden;line-height:0″ class=”mce_SELRES_start”></span><span data-mce-type=”bookmark” style=”display:inline-block;width:0px;overflow:hidden;line-height:0″ class=”mce_SELRES_start”></span>
这篇题为《VCBench:风险投资领域大语言模型基准测试》的研究论文推出了首个开源基准VCBench,用于检验AI能否预判初创企业成功。团队构建了包含9000份匿名创始人档案的数据集,每份档案均匹配早期公司数据。其中约810份被标记为”成功”案例(定义为实现退出或IPO等重大成长里程碑),为模型提供了稀疏但有效的训练信号。
关键的是,研究人员清除了数据集中的姓名与直接标识符,防止模型简单记忆Crunchbase的公开信息。他们甚至进行了对抗测试,确保大语言模型无法通过公开数据重新识别创始人,在保留预测特征的同时将再识别风险降低92%。
测试结果显示,模型表现远超人类基准。论文指出”市场指数”——即所有早期风投的基准表现——精确率仅为1.9%(即每50次尝试命中1次)。Y Combinator达到3.2%,约为市场水平的1.7倍;一线风投机构约为5.6%,近乎翻倍。
而大语言模型彻底突破了这一基线。
DeepSeek-V3的精确率达到市场指数的六倍以上,GPT-4o则以最高F0.5分数位居榜首,在精确率与召回率间取得最佳平衡。Claude 3.5 Sonnet和Gemini 1.5 Pro同样轻松超越市场,达到与顶级风投相当的水准。
换言之,几乎所有前沿大语言模型识别潜力企业的能力都优于普通风投机构,部分模型甚至达到或超越了Y Combinator与顶级基金的预测水平。
研究人员已在vcbench.com公开VCBench基准,邀请社区测试自有模型并发布结果。若排行榜持续出现超越市场表现的AI模型,早期投资格局或将重塑。由AI代理扫描LinkedIn发掘创始人,而非通过海量邮件触达合伙人的时代,或许已不再遥远。
通用智能通讯
© 版权声明
文章版权归作者所有,未经允许请勿转载。