
洞察预览
优秀的 AI 实际上评估什么
第一部分划出了一条界线,而招聘技术市场一直努力模糊这条界线:自动化一个破碎的流程,与提升招聘质量,之间有重大区别。
本篇文章讨论第二条路径。如果一个系统要声称具备智能,它应能解释其实际评估的内容以及为何这些信号重要。
信号问题
每个AI招聘工具都会评估某些内容。真正的问题是,那些内容是否能预测你关心的结果:一个人在特定岗位、特定环境中是否能胜任并表现良好。
大多数系统仍然评估代理指标。头衔、工作年限、资质证书和关键词密度等与结果常有相关性,看起来有用,但相关性并不等同于预测。
正是这道差距导致了许多招聘失败。Harvard Business School 和 Accenture 的研究记录到,合格候选人经常被降级优先级,因为他们的背景没有产生“正确”的标记,即使其潜在能力存在。
真正的能力评估基于不同的前提:一个人能做什么、如何解决问题、以及在相似场景中的表现,比简历的外观形式更重要。

真正的能力评估关注什么
可展示的工作成果。首要问题是候选人实际创造、改变或解决了什么,而不仅仅是他们名义上的职责。
解决问题的方法。一个人在推理并应对挑战时的方式,往往比他们是否见过完全相同的情形更能预测表现。
情境适配性。若领导风格、团队结构或运营条件存在实质差异,在一个组织表现优秀的候选人在另一个组织也可能不合适。
看的是轨迹,而非快照。简历只捕捉到一个时点。更好的评估关注候选人随时间的发展及其能力是否在不断累积增长。

为什么通用模型做不到这一点
大型通用模型擅长在广泛数据中识别模式。它们可以筛选出与在其他环境中历来表现良好的人群相似的候选人。
它们无法自动理解你的组织的具体情况。除了通用训练数据中可见的信息外,它们不了解你顶尖员工之间的共同特征。
这一局限性很重要。能预测在高速成长的软件公司中资深工程师成功的信号,并不等同于能预测在受监管的金融机构中资深工程师成功的信号。
在你的环境、工作流程以及真实顶尖员工模式上训练出的情境特定模型,能做出与你关注的结果相校准的决策,而不是基于他人通用数据的宽泛推断。

实践中的表现
实际差异在面试阶段显现。代理指标评估会把那些背景最像以往被录用人员的候选人推到前面。
能力评估会推荐那些已证明具备相关技能和行为的候选人,即便他们发展这些能力的路径在纸面看起来不够常规。
这不仅改变排名,更改变候选池本身,因为那些会被代理逻辑筛除的候选人现在变得可见。
本系列的最后一篇文章讨论买方视角:当供应商声称其系统能做出更好的招聘决策时,HR领导者应提出哪些要求。
结论
- 优秀的AI评估能力、情境和发展轨迹,而不是单靠简历代理指标。
- 实际效果不仅是对熟悉候选人的不同排序,而是获取一个不同且通常更强的候选池。
参考资料
- 1. Harvard Business School 和 Accenture。《Hidden Workers: Untapped Talent》。https://www.hbs.edu/managing-the-future-of-work/Documents/research/hiddenworkers09032021.pdf
- 2. Harvard Business School Working Knowledge。《How to Tap the Talent Automated HR Platforms Miss》。https://www.library.hbs.edu/working-knowledge/how-to-tap-the-talent-automated-hr-platforms-miss