こんにちは。アメリカ企業でHRのデータサイエンティストとして働いているSeanです。
本サイトでは、People Analytics分野のスキル・知識を習得したい方向けに定期的に「People Analyticsのイロハ」を紹介しています。
今回の記事では、People Analyticsの分析に必要な基礎的な知識として、「変数」の概念についてまとめています。
統計学の分野について、専門的な知識を深めていくと際限がないですが、ここではPeople Analyticsの分析にあたり、手っ取り早く概要を理解したいという方向けに押さえておくべき要点に絞って解説していきます。
Contents
People Analyticsに必要な基礎知識|変数
ある課題に対する研究や分析の中で、変化しうる数値やデータのことを変数と呼びます。
それぞれの変数は、その関係性に応じて異なる名称で呼ばれます。
その中で、今回はPeople Analyticsで意識すべき「独立変数」、「従属変数」、「媒介変数」、「調整変数」の4つの変数について述べています。
People Analyticsの効果的な分析のためには、ビジネスケースにおける様々なデータの中で、どの変数を含めるのか?どの変数を見つけることが必要なのか?という点を意識することが重要になってきます。
独立変数と従属変数とは?
独立変数は、従属変数の影響を調査するために変更または制御される変数のことを指します。
簡単に言うと、ある因果関係において、独立変数は「原因」で、従属変数は「それによって引き起こされる結果」です。
ある事象(B)がある要因(A)によって起きたものだと考えた場合、
(A)=独立変数
(B)=従属変数
となり、(A)をどう変えるかによって、(B)に影響を及ぼします。
そのため、独立変数はインプット、従属変数はアウトプットと呼ばれることもあります。
例えば、ある文献によると、従業員の性格がパフォーマンスに影響を与えるとされており、外向的な性格や良心的な性格に関するスコアが高い従業員の方が優れたパフォーマンスを発揮することが研究で示されました。
この場合、
独立変数(A)=従業員の性格(性格に関するスコア)
従属変数(B)=従業員のパフォーマンス
ということになります。
もし仮に従業員をより外向的な性格に変えることが出来れば、従業員のパフォーマンスも同時に良くなることが予測できます。
この「独立変数」と「従属変数」が分析のベーシックな2つの変数です。
コントロール変数とは?
合わせて理解しておくべき変数として「コントロール変数」というものがあります。
この変数も「従属変数」に影響を与えるものであり、分析の際に考慮すべき変数の1つです。
「独立変数」と「従属変数」の関係性の有無だけにフォーカスしたい際に「従属変数」に余分な影響を与えることを避けるために、調整・制御しておくべき要因が「コントロール変数」です。
例えば、性格とパフォーマンスの関係性を分析しようとして、性格テストが異なる2人の従業員同士を比較しても、一方は勤続20年の大ベテランでもう一方が新入社員だと発揮するパフォーマンスに大きな差が出てしまいますよね。
そうすると、2人の間にパフォーマンスの差が見られたとしても、その原因が性格による影響なのか、もしくは勤続年数や年齢など他の要因によるものなのかということを特定することが出来なくなってしまいます。
実際に、これらの項目についても従業員のパフォーマンスに関係すると証明されています。
そのため、性格とパフォーマンスの関係性だけを分析したい場合、性格テストのスコアに加えて、性別、年齢、勤続年数、教育レベルなど関係しうる複数の項目について考慮に入れ、ある程度、分析の条件を絞ったり分類したりする必要があります。
この場合、
独立変数(A)=従業員の性格(性格に関するスコア)
従属変数(B)=従業員のパフォーマンス
コントロール変数(C)=性別、年齢、勤続年数、教育レベル…etc.
となります。
このように、余分な変動要因が含まれてしまうことを考慮し、有効な分析結果を得るために、「独立変数」を制御・コントロールするための変数が「コントロール変数」であり、People Analyticsの分析で重要な変数の1つです。
モデレーター変数とは?
「モデレータ変数」とは「独立変数」と「従属変数」の関係に影響を与えうる変数のことです。
上記の例で、従業員の性格とパフォーマンスの間に関係性があることを述べましたが、仮にある従業員について、締め切りに追われる等の時間的なプレッシャーがあるかないかで、この性格とパフォーマンスの間の関係性に変化が生じるでしょうか?
ある文献では、時間的なプレッシャーが全くない状況化では、従業員の性格とパフォーマンスの間の関係への影響はありませんでしたが、高いプレッシャーがある状況化では、その関係性は弱くなることと言われています。
この場合、
独立変数(A)=従業員の性格
従属変数(B)=従業員のパフォーマンス
モデレーター変数(D)=時間的なプレッシャー
となり、(A)と(B)が同一でも(D)によってその関係性に影響を及ぼします。
尚、この場合でも、コントロール変数(C)は常に考慮すべき対象です。
メディエイター変数とは?
「メディエイター変数」とは、「媒介変数」と呼ばれることもありますが、「独立変数」と「従属変数」の間の因果関係を媒介する特定の変数のことを指します。
直接的に因果関係を持たない「独立変数」と「従属変数」の間に、それぞれに因果関係をもつ変数を媒介させることで、「独立変数」と「従属変数」の間の関係性を説明する、といったように用います。
例えば、従業員の性格とエンゲージメントの間の傾向を見つけ、別の分析で高いエンゲージメントをもつ従業員はパフォーマンスが高くなる傾向を見つけたという場合、
独立変数(A)=従業員の性格
メディター変数(D)=従業員のエンゲージメントレベル
従属変数(B)=従業員のパフォーマンス
となり、(D)を介することによって、(A)と(B)が関係があることを説明することを可能とします。
A.独立変数:従属変数が生じた原因
B.従属変数:独立変数に依存して変わる結果
C.コントロール変数:主に測定したい影響を説明するために制御される要因
D.メディエイター変数:独立・従属変数の間の関係性に影響を与える要因
E.モデレーター変数:独立・従属変数の関係を説明するための媒介
5つの変数を用いたPeople Analyticsの進め方
5つの変数の考え方をベースにすると、People Analyticsにおける分析は下記のように進められることが多いです。
People Analyticsの一般的な進め方
- 自社の中で解決したい課題を明確にする
- 課題解決のために答えるべき適切な設問を設定
- そのために原因を特定すべき「従属変数」を設定
- 「従属変数」の原因となりうる「独立変数」を仮定
- 「コントロール変数」の影響を考慮し、分析条件を調整
- 正しいデータと変数が選択されているかをチェック
- 適する分析手法を用いて「メディター変数」を想定しながら因果関係を特定
- ○因果関係が特定できた
→ 最初の設問に回答、アクションプランの検討×因果関係が特定できない
→ 「モデレーター変数」を介して特定できるか分析
→ 別の「独立変数」で分析
分析のポイントとしては、独立変数(A)と従属変数(B)が有意かどうか、つまり、(B)が生じたのは、偶然や誤差ではなく、(A)によって起こるべくして起こった事象であるかどうかという点に着目することです。
何度もこの手順を繰り返しながら、因果関係を特定し分析の精度やレベルを高めていきます。
People Analyticsの分析レベルの成熟度ついては、下記の記事に纏めていますので参考にしてみてください。
まとめ
People Analyticsの分析レベルが上がっていくと、データの数が増え、分析も複雑になってきます。
本記事で紹介した変数は統計学における基礎的な知識の1つです。
しかし、分析がどれだけ高度になっても、常に対象となるデータがどの変数にあたるのかを意識することは、効果的なPeople Analyticsの分析を行う上で、非常に重要なポイントです。
分析を行う際の参考にしてみてください。