はじめに —— 評価ブレは「担当者の能力」の問題ではない

「うちは評価がばらばらなんですよ」

採用に関わる企業から、この相談は驚くほど頻繁に出てくる。特に、選考に複数の担当者が関わる中途採用では、ほぼ全社が経験している課題だ。

だが、多くの企業はこの問題を「担当者のスキル不足」として片付けようとする。評価者研修を実施し、「こういう観点で見てください」と伝え、それで改善したつもりになる。

結論から言えば、評価ブレは個人の能力の問題ではない。仕組みの問題だ。

どれほど優秀な採用担当者でも、以下の条件下では評価がブレる:

評価基準が明文化されていない
「良い候補者」の定義が共有されていない
書類選考と面接で何を確認するかの分担が曖昧

この記事では、評価ブレが起きる5つの構造的原因を分析し、「仕組み」で一貫性を担保する方法を解説する。

評価ブレがもたらす3つの経営インパクト

「評価がバラバラでも、最終的に良い人が採れていればいいのでは？」

そうではない。評価ブレは選考品質だけでなく、採用活動全体のROIを毀損する。

インパクト	発生メカニズム	定量的な影響
面接官の工数浪費	書類で止めるべき候補者が面接に進む。担当者Aが「通過」、本来Bなら「不通過」の判断	面接1回あたり1.5時間（準備+実施+FB記入）× 月5〜10名 = 月7.5〜15時間の無駄
優秀人材の取りこぼし	「迷ったら落とす」傾向が強まる。特に非典型キャリアの候補者が犠牲になる	本来採用できた人材の機会損失（年収500万円のポジション × 採用遅延1ヶ月 = 約42万円/月の生産性損失）
候補者体験の悪化	同じ質問を書類と面接で繰り返す。選考リードタイム長期化	候補者の離脱率15〜25%増加（リードタイム1週間延長ごとに約10%増加）

特に深刻なのは「優秀人材の取りこぼし」だ。評価基準が曖昧な組織では、判断に自信がない担当者ほど「リスク回避」で不通過にする。結果として、ユニークな経歴を持つポテンシャル人材ほど書類で落とされる。

構造的原因1: 評価基準の「暗黙知化」

問題

多くの企業で、書類選考の評価基準は求人票（JD）の要件だけだ。だが、実際の選考では求人票に書かれていない判断軸が大量に存在する。

JDに書かれている要件	実際に判断に使われている暗黙の基準
Go / TypeScript 3年以上	「有名企業での経験があるか」
チーム開発経験	「転職回数が多すぎないか」
日本語ビジネスレベル	「職務経歴書の書き方が丁寧か」

問題は、この暗黙の基準が担当者ごとに違うことだ。

Aさんにとっての「良い候補者」は「大手出身で安定したキャリア」、Bさんにとっては「スタートアップ経験豊富でスピード感がある人」。どちらも間違いではないが、基準として共有されていないため、同じ候補者への評価が真逆になる。

なぜ放置されるか

「わざわざ言語化するほどのことではない」と思われている。 経験豊富な採用担当者ほど、自分の判断基準を「当然のこと」と考え、言語化の必要性を感じない。だが、その「当然」は他の担当者と一致していない。

対策

評価観点の棚卸しワークショップを実施する。選考に関わる全員が「自分は何を見て判断しているか」を書き出し、テーブルに並べる。一致している観点は基準として採用し、不一致の観点は議論して統一する。

構造的原因2: 認知バイアスの不可避な介入

問題

人間の判断には認知バイアスが必ず介入する。これは個人の能力とは無関係で、人間の認知構造に起因する。

書類選考で頻繁に発生するバイアスは以下の5つ。

バイアス	内容	書類選考での発現例
ハロー効果	1つの優れた特徴が全体の評価を引き上げる	「東大卒」を見た瞬間、他の項目もプラスに評価
確証バイアス	自分の仮説を支持する情報だけを拾う	「この人は良さそう」と思ったら、経歴の良い部分だけを読む
アンカリング	最初に見た情報に引きずられる	1人目が優秀だと、2人目以降が相対的に低く見える
類似性バイアス	自分と似た人を高く評価する	同じ大学出身、同じ業界出身の候補者を無意識に優遇
疲労効果	大量の書類を見ると判断力が低下する	50件目以降は「流し読み」で判断が雑になる

認知バイアスの怖さ

バイアスの最大の問題は、当事者が気づかないことだ。

「自分は公平に評価している」と確信している担当者ほど、バイアスの影響を強く受けている。なぜなら、バイアスに対する警戒心が低いからだ。

ある調査では、採用担当者の78%が「自分は公平に評価できている」と回答したが、実際の評価データを分析すると、出身大学と通過率の間に統計的に有意な相関が見つかった。

対策

バイアスは「気をつける」では排除できない。仕組みで制御する必要がある。

対策	効果	実装コスト
ブラインドレビュー（氏名・写真・学歴を隠す）	ハロー効果・類似性バイアスを大幅軽減	中
構造化スコアリング（項目ごとに数値評価）	確証バイアスを軽減。「なんとなく」を排除	低
評価順序のランダム化	アンカリング効果を軽減	低
1日の評価件数の上限設定（20件まで等）	疲労効果を軽減	低
複数人評価 + 差異検出	すべてのバイアスに有効。判断の分裂を可視化	中

構造的原因3: 「求人要件」と「選考基準」の混同

問題

多くの企業は「求人票に書いてある要件 = 書類選考の基準」と思っている。

だが、求人要件と選考基準は別のものだ。

	求人要件（JD）	選考基準
目的	応募者を集める	応募者を評価する
粒度	大まか（「3年以上の経験」）	具体的（「Go 3年 + チームリード経験 = 20点」）
対象	候補者向け	評価者向け
更新頻度	求人ごとに作成	選考結果を見て随時更新

求人要件は「応募してほしい人の条件」であり、「どう評価するか」の設計は含まれていない。

たとえば「Go 3年以上」という要件に対して:

自社開発でGo 3年 vs 受託開発でGo 5年はどちらが高評価か？
Go 2年 + Rust 3年はMust未達で不通過か？
フリーランスでGo 3年は実務経験としてカウントするか？

これらの判断基準は求人票には書かれない。だから担当者ごとに判断が割れる。

対策

求人票とは別に「選考基準シート」を作成する。求人票から選考基準への変換プロセスを設計することで、要件と基準の混同を防ぐ。

変換のフレームワーク:

求人要件（JD）
  ↓ 変換プロセス
  ├── Must要件（これがないと不通過）
  ├── Want要件（加点評価）+ ウェイト配分
  ├── NG要件（即不通過）
  └── 判断に迷うケースの処理ルール
  ↓
選考基準シート（評価者が使う）

構造的原因4: 書類選考と面接の「分断」

問題

書類選考で確認したことを面接で再確認し、面接で聞くべきことを書類で判断しようとする。この「役割分担の曖昧さ」が、選考全体の一貫性を壊す。

典型的な分断パターン:

問題	発生状況	結果
書類で確認済みのことを面接で再確認	「ご経歴を教えてください」から面接が始まる	候補者は「書類に全部書いたのに」と不満。面接時間の無駄
面接で聞くべきことを書類で判断	「コミュニケーション力」を職務経歴書の文章量で推測	文章が苦手だが対面では優秀な候補者を見落とす
書類の評価コメントが面接官に伝わらない	採用担当者の「技術力は高いが、マネジメント経験が不明」というメモが面接官に共有されない	面接官が同じ確認をゼロから行う

本来あるべき役割分担

選考段階	確認すべきこと	確認方法
書類選考	スキル・経験の事実確認（定量的に判断可能なもの）	職務経歴書の記載内容をスコアリング
面接	思考プロセス・カルチャーフィット・動機（対話でしか分からないもの）	構造化面接で深掘り

対策

「書類選考で確認済み」「面接で確認必要」のフラグを候補者ごとにつける。

書類選考の評価結果を面接官に引き継ぐ際、以下を含める:

書類で確認済みの項目とそのスコア
書類だけでは判断できなかった項目（面接で要確認）
候補者の強み（深掘りすべきポイント）
候補者の懸念点（面接で解消すべきポイント）

この引き継ぎがあるだけで、面接の質が劇的に変わる。面接官は「何を聞くべきか」が事前に分かるため、限られた時間で本質的な確認に集中できる。

構造的原因5: フィードバックループの不在

問題

多くの企業で、書類選考の「答え合わせ」が行われていない。

書類で「A評価」をつけた候補者が面接で落ちたとき、「なぜ書類でA評価だったのか」を振り返る仕組みがない。逆に、書類で「C評価（保留）」だった候補者が最終的に内定・活躍しているケースがあっても、そのフィードバックが書類選考の基準改善に活かされない。

フィードバックがないと、基準は永遠に改善されない。

フィードバックがある組織	フィードバックがない組織
書類評価と面接結果の乖離を月次で分析	「書類は通しただけ」で終わり
乖離パターンから基準を修正	同じ判断ミスを繰り返す
半年後には評価精度が向上	何年経っても「評価がバラバラ」

最小限のフィードバックループ

タイミング	やること	所要時間
毎週	書類通過者のうち、面接で不通過になった候補者をリストアップ	10分
毎月	書類評価と最終結果の一致率を集計。乖離率が高い評価項目を特定	30分
四半期	内定者の書類スコアを遡って分析。「内定者が高スコアになる基準か」を検証	1時間

評価ブレを構造的に解消する4つの施策マトリクス

5つの原因に対して、施策を「効果 × 導入コスト」で整理する。

施策	対応する原因	効果	導入コスト	推奨順序
① 評価基準の明文化（Must/Want/NG）	原因1, 3	★★★	低	最初にやる
② 構造化スコアリングシート	原因2, 3	★★★	低	2番目
③ 書類→面接の引き継ぎテンプレート	原因4	★★☆	低	3番目
④ 月次フィードバックレビュー	原因5	★★★	中	4番目
⑤ ブラインドレビュー導入	原因2	★★☆	中	余力があれば
⑥ AI評価支援の導入	原因1, 2, 5	★★★	中〜高	基盤整備後

推奨アプローチ: ①→②→③→④の順に、1つずつ導入する。4つすべてが揃ったとき、評価の一貫性は構造的に担保される。

いきなり全部やろうとすると現場の負担が大きい。まず①（評価基準の明文化）だけでも、評価ブレの半分は解消できる。

まとめ —— 「人を変える」のではなく「仕組みを変える」

採用選考の評価ブレは、5つの構造的原因から生じている。

#	構造的原因	本質
1	評価基準の暗黙知化	「何を見るか」が共有されていない
2	認知バイアスの介入	人間の認知構造上、避けられない
3	求人要件と選考基準の混同	「要件」と「評価方法」は別物
4	書類と面接の分断	確認事項の役割分担がない
5	フィードバックループの不在	基準が改善されるサイクルがない

共通するのは、**どれも「担当者個人の問題」ではなく「組織の仕組みの問題」**だということだ。

評価者研修で「公平に評価しましょう」と伝えても、仕組みが変わらなければ結果は変わらない。評価基準を明文化し、スコアリングを構造化し、選考段階の役割を分担し、フィードバックで基準を改善する——この4つの仕組みが、評価の一貫性を担保する。

Tasonal AI書類選考は、評価ブレの構造的原因を仕組みで解消する。求人要件をもとにAIが評価項目を構造化し、全候補者を同じ基準で0〜100点スコアリング。強み・懸念点の自動抽出と面接質問リストの自動生成で、書類→面接の引き継ぎもシームレスに。判断は人がする。AIはその判断材料を揃える。

→ 無料で試してみる

同じ候補者を5人が見て、5通りの評価が出る理由｜採用選考の「評価ブレ」5つの構造的原因と対策