とっ散らかったデータのクレンジングに半年間
10月20日(現地時間)から5日間の日程で開催された米テラデータのユーザー向けコンファレンス「Teradata Universe 2019」(開催地:米国コロラド州デンバー)では、HR Techの活用事例紹介セッションに、ヤフー株式会社 ピープル・デベロップメント統括本部 コーポレートPD本部 部長(2019年10月現在)の遠藤禎士氏が登壇。「Workforce Analytics accelerating business strategy(ビジネス戦略を加速させるピープルアナリティクス)」と題し、ヤフーが取り組むピープルアナリティクスを説明した。
1996年設立のヤフーは6515人の従業員を抱える(2019年3月31日)大手IT企業だ。社員の平均年齢は35.6歳(同)で、平均勤続年数は6.3年(有価証券報告書による)。副業の解禁やフリーアドレス制、月5日まで社員が好きな場所で働ける「どこでもオフィス」の導入など、先進的な人事制度を積極的に取り入れている。
ヤフーがHR Techに注力する主な目的は、「人事管理業務の改善と効率化」「適材適所の人材配置」「人材育成」である。そのために実施しているのが「ピープルアナリティクス」だ。ピープルアナリティクスとは、人事データ分析から得られた知見を活用し、課題解決に至るプロセスを指す。具体的には「ビジネスニーズと戦略の理解」「課題の洗い出し」「利用可能なデータの選択」「分析用データの準備」「データ分析とその可視化」「分析結果に基づく行動」「継続的な監視と測定」といったプロセスだ。
ピープルアナリティクスを実施するためには、“きちんとしたデータ”を揃える必要がある。遠藤氏がピープル・デベロップメント統括本部の部長として最初に行ったのは「バラバラなデータを整理する」ことだったという。
「データの“バラバラ度”はひどいものでした(笑)。採用データは約5~6年分が蓄積されていたのですが、データの定義が短期間で変更されていたり、データの一部が欠損していたり、データの種類がバラバラだったりと、エンジニアの私が見ても、それが何を意味するデータなのかを理解できない。最初の仕事は『これは何のデータか』を紐解くことでした」(遠藤氏)
遠藤氏は半年かけて、10を超える人事関連システムから従業員の評価、勤怠、目標管理などのデータに対してデータクレンジングを実施し、「Teradata Database」に集約。Teradataの一領域を使ってデータマートとして使えるようにした。また実験的ではあるが一部位置情報なども分析を試みている。
これらのデータを分析して可視化することで現状を把握し、課題を洗い出して改善のアクションにつなげていく。その際に心がけたことは、「プライバシー保護の徹底」と「分析システムとオペレーションシステムの分離」だ。特に、分析に使うデータは、人事関連システムから分離して利用することを徹底した。その理由について遠藤氏は次のように語る。
よく、混ぜるな危険と言っていますが、分析用システムとオペレーションシステムは分けるようにしています。そもそも、分析要件とオペレーション要件は異なります。たとえば、ディープラーニングによる分析でシステムに負荷がかかり、オペレーションが停止すれば、ヤフー全体の業務に支障をきたす。そうした事態は避けなければいけません」(遠藤氏)