Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考

admin 百科 2025-12-23 18

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第1张图片-佛山资讯网

https://www.php.cn/link/5f4d4b4da67c9adec00590be5904256e

工作的核心本质 —— 判断力、主体性，以及AI评估体系的内在局限

Thomas Wolf 2025年12月22日

十五年前，正值2010年寒冬，我正处在博士学业的收官阶段，开始认真思考学术圈之外的职业可能。至今仍清晰记得，在一个破纪录低温的巴黎冬日，我刚结束一场研发岗位的面试，搭乘通勤列车返程。窗外白雪皑皑，车厢内寒气逼人，而我的内心则交织着失落与不解。

我对该团队日常使用的多数开发工具都已熟悉，也确信自己能迅速掌握其余部分。但显然，这并不足以打动面试官——他们反复强调，正在寻找“更有经验”的候选人。

彼时，我并未真正领会这句话背后的分量。相较于我能明确展示的技术能力，对方更看重的是工作年限。这让我倍感不公：在我二十出头的年纪，“经验”听起来更像一种含糊其辞的托词，用以婉拒那些既具备扎实基础、又满怀热忱的学习者。

这种久违的情绪，最近又一次悄然浮现。

当看到近期关于初级岗位招聘持续收缩的数据（尤其在软件工程领域），我不由得再次想起当年那个坐在冰冷车厢里的自己。

斯坦福大学于2025年夏季发布的一项研究指出，在AI暴露度最高的职业类别中，22至25岁从业者的人数自2022年底至2025年年中下降了约6%；而同期，同一批职业中的资深从业者数量却上升了6–9%。

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第2张图片-佛山资讯网

图表上的拐点一目了然。

无论源于相关性抑或因果关系，2022年秋季正是ChatGPT正式发布的节点——那是公众首次真切感知大模型实际能力的时刻，也是全球AI性能竞赛全面爆发的起点。这场竞赛最初由OpenAI与Anthropic引领，随后Google、xAI、阿里巴巴（Qwen）、DeepSeek、Mistral等越来越多的机构纷纷跻身第一梯队。

过去三年间，AI评测基准（Benchmarks）的进步令人震撼。例如Claude Opus 4.5如今在SWE-bench上可完成约75%的真实编程任务；Gemini 3与GPT-5已在国际科学奥林匹克竞赛中稳居金牌水准⁴。与此同时，ChatGPT的周活跃用户已逼近10亿大关⁵。

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第3张图片-佛山资讯网

从诸多技术维度看，AI的能力跃升与普及速度惊人，常被解读为已逼近甚至达到人类专家水平。

然而，尽管奖牌频出、初级岗持续萎缩，宏观经济层面的反馈却远未达预期。

在全球及行业尺度上，AI对GDP的实际拉动效应依然微弱。有观点指出，在那些光鲜亮丽的新闻稿背后，大量（若非绝大多数）生成式AI试点项目尚未为企业带来可持续的价值⁷。此外，在更贴近现实场景的测试中——比如以真实兼职任务为基准的“远程劳动指数”（Remote Labor Index），即便是当前最强的AI Agent系统（如ManusAI），整体成功率也仅徘徊在2.5%左右。

模型在标准评测中展现的强大能力，与其在组织内部真实落地的效果之间，呈现出显著张力。

对于这种“理论高光”与“实践黯淡”的落差，常见解释包括：一是组织惯性——大型企业响应迟缓、遗留系统庞杂、部署路径艰难；二是能力阈值尚未突破——或许在通往AGI的量化路径上，哪怕取得接近60%的综合得分，仍不足以支撑复杂决策闭环。

这些因素确实都在起作用。但它们往往默认将“工作”窄化为一系列可拆解、可分配、可执行的任务集合。

标签： go 工具 ai chatgpt openai gpt gpt-5 google claude 大模型阿里巴巴 gem