Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考

admin 百科 18

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第1张图片-佛山资讯网

https://www.php.cn/link/5f4d4b4da67c9adec00590be5904256e


工作的核心本质 —— 判断力、主体性,以及AI评估体系的内在局限

Thomas Wolf 2025年12月22日

十五年前,正值2010年寒冬,我正处在博士学业的收官阶段,开始认真思考学术圈之外的职业可能。至今仍清晰记得,在一个破纪录低温的巴黎冬日,我刚结束一场研发岗位的面试,搭乘通勤列车返程。窗外白雪皑皑,车厢内寒气逼人,而我的内心则交织着失落与不解。

我对该团队日常使用的多数开发工具都已熟悉,也确信自己能迅速掌握其余部分。但显然,这并不足以打动面试官——他们反复强调,正在寻找“更有经验”的候选人。

彼时,我并未真正领会这句话背后的分量。相较于我能明确展示的技术能力,对方更看重的是工作年限。这让我倍感不公:在我二十出头的年纪,“经验”听起来更像一种含糊其辞的托词,用以婉拒那些既具备扎实基础、又满怀热忱的学习者。

这种久违的情绪,最近又一次悄然浮现。

当看到近期关于初级岗位招聘持续收缩的数据(尤其在软件工程领域),我不由得再次想起当年那个坐在冰冷车厢里的自己。

斯坦福大学于2025年夏季发布的一项研究指出,在AI暴露度最高的职业类别中,22至25岁从业者的人数自2022年底至2025年年中下降了约6%;而同期,同一批职业中的资深从业者数量却上升了6–9%。

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第2张图片-佛山资讯网

图表上的拐点一目了然。

无论源于相关性抑或因果关系,2022年秋季正是ChatGPT正式发布的节点——那是公众首次真切感知大模型实际能力的时刻,也是全球AI性能竞赛全面爆发的起点。这场竞赛最初由OpenAI与Anthropic引领,随后Google、xAI、阿里巴巴(Qwen)、DeepSeek、Mistral等越来越多的机构纷纷跻身第一梯队。

过去三年间,AI评测基准(Benchmarks)的进步令人震撼。例如Claude Opus 4.5如今在SWE-bench上可完成约75%的真实编程任务;Gemini 3与GPT-5已在国际科学奥林匹克竞赛中稳居金牌水准⁴。与此同时,ChatGPT的周活跃用户已逼近10亿大关⁵。

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考-第3张图片-佛山资讯网

从诸多技术维度看,AI的能力跃升与普及速度惊人,常被解读为已逼近甚至达到人类专家水平。

然而,尽管奖牌频出、初级岗持续萎缩,宏观经济层面的反馈却远未达预期。

在全球及行业尺度上,AI对GDP的实际拉动效应依然微弱。有观点指出,在那些光鲜亮丽的新闻稿背后,大量(若非绝大多数)生成式AI试点项目尚未为企业带来可持续的价值⁷。此外,在更贴近现实场景的测试中——比如以真实兼职任务为基准的“远程劳动指数”(Remote Labor Index),即便是当前最强的AI Agent系统(如ManusAI),整体成功率也仅徘徊在2.5%左右。

模型在标准评测中展现的强大能力,与其在组织内部真实落地的效果之间,呈现出显著张力。

对于这种“理论高光”与“实践黯淡”的落差,常见解释包括:一是组织惯性——大型企业响应迟缓、遗留系统庞杂、部署路径艰难;二是能力阈值尚未突破——或许在通往AGI的量化路径上,哪怕取得接近60%的综合得分,仍不足以支撑复杂决策闭环。

这些因素确实都在起作用。但它们往往默认将“工作”窄化为一系列可拆解、可分配、可执行的任务集合。

标签: go 工具 ai chatgpt openai gpt gpt-5 google claude 大模型 阿里巴巴 gem

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~