优秀的 AI 实际评估什么：AI 能做什么与不能做什么（第二部分）

洞察预览

优秀的 AI 实际上评估什么

第一部分划出了一条界线，而招聘技术市场一直努力模糊这条界线：自动化一个破碎的流程，与提升招聘质量，之间有重大区别。

本篇文章讨论第二条路径。如果一个系统要声称具备智能，它应能解释其实际评估的内容以及为何这些信号重要。

信号问题

每个AI招聘工具都会评估某些内容。真正的问题是，那些内容是否能预测你关心的结果：一个人在特定岗位、特定环境中是否能胜任并表现良好。

大多数系统仍然评估代理指标。头衔、工作年限、资质证书和关键词密度等与结果常有相关性，看起来有用，但相关性并不等同于预测。

正是这道差距导致了许多招聘失败。Harvard Business School 和 Accenture 的研究记录到，合格候选人经常被降级优先级，因为他们的背景没有产生“正确”的标记，即使其潜在能力存在。

真正的能力评估基于不同的前提：一个人能做什么、如何解决问题、以及在相似场景中的表现，比简历的外观形式更重要。

可展示的工作成果。首要问题是候选人实际创造、改变或解决了什么，而不仅仅是他们名义上的职责。

解决问题的方法。一个人在推理并应对挑战时的方式，往往比他们是否见过完全相同的情形更能预测表现。

情境适配性。若领导风格、团队结构或运营条件存在实质差异，在一个组织表现优秀的候选人在另一个组织也可能不合适。

看的是轨迹，而非快照。简历只捕捉到一个时点。更好的评估关注候选人随时间的发展及其能力是否在不断累积增长。

大型通用模型擅长在广泛数据中识别模式。它们可以筛选出与在其他环境中历来表现良好的人群相似的候选人。

它们无法自动理解你的组织的具体情况。除了通用训练数据中可见的信息外，它们不了解你顶尖员工之间的共同特征。

这一局限性很重要。能预测在高速成长的软件公司中资深工程师成功的信号，并不等同于能预测在受监管的金融机构中资深工程师成功的信号。

在你的环境、工作流程以及真实顶尖员工模式上训练出的情境特定模型，能做出与你关注的结果相校准的决策，而不是基于他人通用数据的宽泛推断。

实际差异在面试阶段显现。代理指标评估会把那些背景最像以往被录用人员的候选人推到前面。

能力评估会推荐那些已证明具备相关技能和行为的候选人，即便他们发展这些能力的路径在纸面看起来不够常规。

这不仅改变排名，更改变候选池本身，因为那些会被代理逻辑筛除的候选人现在变得可见。

本系列的最后一篇文章讨论买方视角：当供应商声称其系统能做出更好的招聘决策时，HR领导者应提出哪些要求。

结论

1. Harvard Business School 和 Accenture。《Hidden Workers: Untapped Talent》。https://www.hbs.edu/managing-the-future-of-work/Documents/research/hiddenworkers09032021.pdf
2. Harvard Business School Working Knowledge。《How to Tap the Talent Automated HR Platforms Miss》。https://www.library.hbs.edu/working-knowledge/how-to-tap-the-talent-automated-hr-platforms-miss

内容支柱