AI偏差値テストは、AIツールを業務活用するうえで重要となる6つの認知・行動能力を、約10分という短時間で可視化するためのスクリーニングツールです。元々は当社(SalesNow)の採用選考で内部利用していたテストを、公開版として一般向けに提供しています。
OECDが2023年に発表した「Skills Outlook 2023」では、AI時代のデジタルリテラシーを構成する主要スキル領域として、批判的評価・創造的AI活用・倫理的判断・継続学習が挙げられています。本テストの6次元はこれらの領域と整合するよう設計されており、各次元の定義はOECD文書を参照しています。ただし、OECDによる公式認定や検証を受けたものではありません。
WEF「Future of Jobs Report 2023」は、2027年までに全労働者の44%のスキルが変化し、分析的思考・創造的思考・技術リテラシーが最需要スキルになると予測しています。本テストはこれらのスキルとの対応関係を意識して設計されており、結果フィードバックでも同レポートのインサイトを参照しています。
上記の国際フレームワークに加え、Stanford HAI「AI Index Report 2024」およびMcKinsey Global Instituteの生成AIレポートを参考に、ビジネスパーソンが実務でAIを活用するうえで最も頻繁に必要となる認知プロセスを6つに絞り込みました。選定基準は次の3点です。
AI が生成した情報の論理的整合性を評価し、ファクトチェックや数値の妥当性を検証する能力。認知バイアスを自覚しながら客観的に情報を吟味できるかを測定します。
生成AIは自信を持った誤情報(ハルシネーション)を出力します。Vosoughi et al.(2018)が示したとおり誤情報は真実より6倍速く拡散するため、一次検証者としての能力は組織リスク管理の基盤です。
特定文脈で学んだパターンや原理を抽象化し、異なるドメインへ転用する能力。AI の出力を素材として新たな価値を生む「遠方転移(far transfer)」を測定します。
Barnett & Ceci(2002)は知識の遠方転移が最も高次の学習成果であることを示しています。AI ツールが普及するほど、出力を素材に独自価値を作れる人材の希少性が増します。
プロンプト設計・ツール選定・タスクの人間/AI分担設計を通じて、AI との協働ワークフロー全体を最適化する能力。
Brynjolfsson & McAfee(2014)の「Racing with the Machine」が示すとおり、AI に代替されるのではなく AI と協働して生産性を拡張するためには、協働設計の実務スキルが不可欠です。
新しい AI ツールや手法を短期間で習得し、自らの AI 依存度と習熟水準を客観的に認識できる能力。メタ認知的学習力を包含します。
OECD Skills Outlook 2019 はデジタル適応力を全労働者の約30%にとって最重要スキルと位置付けています。Dweck(2006)の成長マインドセット研究も、適応的学習姿勢が長期パフォーマンスを左右することを示しています。
AIシステムに内在するバイアス・プライバシーリスク・説明責任を評価し、ステークホルダーに対して適切な判断を下す能力。
Jobin et al.(2019)が世界84のAI倫理ガイドラインを分析した結果、透明性と説明責任が最も共通して重視される原則でした。AI活用が進むほど、倫理的判断力は組織の信頼資本に直結します。
AI活用において仮説を立てて検証サイクルを回し、効果を定量的に測定・改善する能力。Build-Measure-Learn ループを意識的に設計できるかを測定します。
Thomke(2020)は実験文化を持つ企業が意思決定精度を3倍向上させることを示しています。AI活用の試行錯誤を科学的に行える人材は、組織学習の加速エンジンとなります。
制限時間30秒
二択形式の速判断問題。AIリテラシーの直感的反応速度と基礎知識を測定します。正解で1ポイント。
制限時間90秒
4択形式の応用問題。理由付きの思考プロセスを要求し、分析力・判断力を測定します。正解で4ポイント。
制限時間180秒
実務シナリオベースの複合問題。複数要素を統合して最善解を選ぶ高次認知能力を測定します。正解で6ポイント、不正解でも部分点1ポイント。
各問題には獲得可能な最大ポイントがあり(Rapid: 1pt / Standard: 4pt / Case Study: 6pt)、さらに制限時間の60%以内に正解した場合は最大20%のスピードボーナスが加算されます。ただし、回答時間が2秒未満の場合はボーナス対象外となります(不正回答検知)。
各次元のスコアは「獲得ポイント ÷ 最大獲得可能ポイント × 100」で0〜100の百分率(%)に変換されます。6次元の平均が総合スコアとなります。
偏差値は、OECD / WEF等の国際調査を参考に理論的に推定した「母集団基準値(平均・標準偏差)」との相対比較で算出されます。計算式は標準的な偏差値式を用います。
6次元の偏差値プロファイルに基づき、以下のルールでタイプを判定します。
タイプ分類はあくまで結果の解釈を助けるための補助的な説明であり、個人を類型に確定的に当てはめるものではありません。
心理測定学における信頼性(再検査信頼性・内的整合性)および妥当性(内容的妥当性・基準関連妥当性・構成概念妥当性)の正式な検証を行っていません。標準化された心理検査(例: GATB・SHL等)とは異なり、測定精度は専門機関には及びません。本テストの結果を採用の主要評価基準として用いることは推奨しません。
本テストは選択式の行動・判断問題であり、自己評価式アンケートではないため自己申告バイアスは低減されています。しかし、問題文を読んで「正解がわかる」ことと「実際の業務でその行動が取れる」ことには乖離があります。テストスコアが実務行動を完全には反映しない点にご注意ください。
本テストは日本語で作成されており、問題の文脈・事例は主に日本のビジネス環境を想定しています。日本語を母語としない方や異なるビジネス文化的背景を持つ方にとって、言語処理や文化的文脈の解釈に追加の認知負荷がかかり、スコアが過小評価される可能性があります。多言語・多文化環境での利用には注意が必要です。
本テストは受験者の自己管理下で実施されるため、受験環境(集中度・ツール参照・他者の助力等)を統制できません。時間制限は設けていますが、外部リソースの参照を技術的に防ぐことはできません。したがって、比較目的での利用(他者との順位比較等)には追加の文脈情報が必要です。
同一人物が短期間内に再受験した場合、問題への慣れ・練習効果・心理状態の差異によってスコアが変動する可能性があります。スコアの変化が実際のAIリテラシー向上を反映しているかの区別は困難です。
AIツールおよびAI活用のベストプラクティスは月単位で進化しています。本テストの問題内容・正解定義・偏差値基準値は定期的に見直しますが、最新のAIトレンドを常時反映できるとは限りません。現時点でのスコアは、特定時点における能力の断面に過ぎません。
本テストの偏差値算出に用いる母集団パラメータは、OECDおよびWEFのレポートから理論的に導出した推定値です。実際の受験者集団から統計的に導出した値ではないため、偏差値の解釈は「理論的水準との比較」に留める必要があります。実際の受験者母集団の平均・分散が異なる場合、偏差値の相対的な意味合いが変わります。
テスト結果データは固有URLへのアクセスを継続的に提供するため、原則として無期限で保存します。削除をご希望の場合は info@salesnow.jp にご連絡ください。本人確認後、合理的な期間内に対応します。
法令に基づく場合を除き、ユーザーの同意なく個人情報を第三者に提供することはありません。詳細はプライバシーポリシーをご参照ください。
受信するすべてのメールには配信停止リンクが含まれています。配信停止後は以降のメールは送付されません。
本テストは完成品ではなく、継続的に改善中のプロダクトです。以下のサイクルで内容を見直しています。
AIツールおよびビジネス環境の変化に合わせ、四半期ごとに問題・選択肢・正解基準を見直します。正解定義が変化した場合は既存の回答データを遡及して再計算する場合があります。
OECD・WEF等の最新レポートが公表された際に、母集団パラメータを更新します。更新時はその旨を本ページに記載します。
問題の誤り・不適切な表現・改善提案は info@salesnow.jp までご連絡ください。すべてのフィードバックを検討しますが、個別の回答はお約束できません。
本ページの内容は変更の都度更新します。ページ末尾に最終更新日を記載しています。
本テストの設計において参照した主要な文献・レポートを以下に示します。引用の形式は学術的に厳密ではない場合があります。