御園生 銀平(みそのう ぎんぺい)氏
ソフトバンク株式会社 人事本部 戦略企画統括部 人材戦略部 人材戦略課。
HRデータアナリストとしてR/Pythonを用いてピープルアナリティクスに取り組む。採用・配置・退職・エンゲージメント・ハイパフォーマー分析などを実施中。人事内のアナログとデジタルをつなぐことを目指す。Rが好き、猫好き、小説好き。
鹿内 学(しかうち まなぶ)氏
博士(理学)。株式会社シンギュレイト 代表。
働く中でのコミュニケーション・データから関係性に注目した次世代ピープルアナリティクスにとりくむ。代表を務めるシンギュレイトでは1 on 1や会議で利用できる可視化ツールを提供中。働く組織の科学と実用をめざす。情報量規準が好き、サッカー好き、漫画好き。
偏りの発見から得た知見
鹿内学氏(以下、鹿内):まず、お持ちいただいた図を紹介していただけますか。
御園生銀平氏(以下、御園生):アセスメント結果をヒストグラムにしたものを持ってきました(図1)。これは個人のパーソナリティ特性を可視化したもので、ある職種で離職率が高いのはなぜかを探るために行いました。縦軸が人数で、横軸が特性(各人の性質)のスコアを1から10までで表しています。例えば、とある特性のグラフがあったとしましょう。スコアが10に近づくほどその特性が高く、山が高いほどその人数が多いことになります。この場合、グラフが右側に偏っていれば、その性質を持つ人の人数が多いと読み取れます。
もらったデータをとりあえず可視化したのですが、明らかに偏りがあるとわかります。通常は、真ん中が高くなるのですが、どれも右か左に偏っています。これはサンプルに偏りがある可能性を示しています。
図1の結果を見て、不要な要素が含まれているかもしれないと思い、図2の散布図を作ってみました。図1が1つずつパーソナリティ特性を見たのに対し、図2では2つのパーソナリティ特性を組み合わせて見ています。2つの特性に正の相関がある場合は分布が右上がり、負の相関がある場合は左上がりになります。
鹿内:丁寧な可視化ですね。図2の散布図を見ると相関がないものがほとんどで、相関のあるものがいくつかあるとわかります。ここで、変数(要素)を減らそうと考えたのは、この次に行うモデリングなどのためですか。
御園生:モデリングをするときに、相関係数が高い変数が入っていると分析できなくなることがあり、必要ではない変数を除くことが必要なのです。他にもいろいろなパターンを試して、必要なものだけを選びました。