企業として取り組むべきこと
現代においては、多くの方がプライベートなり仕事なりで自由に使えるパソコンをお持ちかと思います。データサイエンスに関する知識は書籍やインターネットから得られますし、データ分析を行うためのソフトウェアも、安価もしくは無償で手に入れられます。
例えば、Microsoft Excelの分析アドイン機能を利用することで、重回帰やロジスティック回帰などを行うことができます。また、RやPythonといったプログラミング言語を勉強すれば、より本格的な環境でデータ分析を実践できます。RやPythonとそのデータ分析用ライブラリはたいてい無償です。
このような時代ですから、「自分で勉強できる人材がデータサイエンティストとして最も成長性するタイプ」というのが私の持論です。私が人事部でデータサイエンティストの採用に関わっていたときも、文系の学生が独学で機械学習を習得し、求人に応募してきたことがありました。
そもそもサイエンティストとは「科学者」であり、データサイエンティストとはデータに基づいて「科学する」ことが仕事です。そして科学者とは、企業などが一から十まで手取り足取り教育して育てるものではない、ということは理解に難しくないかと思います。
そのような中、データサイエンティストやデータサイエンスチームを育成・組成していくために、企業はどんなことに取り組むべきなのでしょうか? 私は、「データサイエンティストとして自ら学び、成長することを支援するための環境・制度作り」だと考えます。具体的には、以下のとおりです。
データサイエンスの必要性について経営トップがコミットする
データ分析に基づく意思決定が定着していない企業においては、経験が重視されるあまりにデータ分析結果を軽んじる場合があります。そのような企業においては、データサイエンティストが得た洞察を業務に適用しようとしても、現場の大きな反発にあってしまうといったことが起こります。経営トップがデータ活用の高度化を強くコミットし、データサイエンティストの活動を後押しすることが重要です。
リーダーをアサインする
前回述べたとおり、データサイエンティストの育成やデータサイエンスチームの組成を始めるためには、求めるレベルや役割、取り組むべきテーマをデザインする必要があります。そのタスクを推進するためのリーダーをアサインする必要がありますが、これからデータサイエンティストの育成を始めようという企業においては、適任者がいないことも考えられます。その場合には分析コンサルタントなどを招き入れ、必要な技術・知識体系の整理やデータサイエンスチームの体制デザインを依頼するなど、外部の力を頼ることも検討すべき手段となります。
分析環境を整備する
データ分析とデータに基づく意思決定を継続的に実施していくためには、データベースと分析ツールの整備が必要不可欠です。自社で利用可能なデータの機密性やボリュームにより、オンプレミス(自前所有)とシステムとするか、クラウドサービスを利用すべきかなどの要件も異なってきます。
また、分析ツールについても、基本的な分析手法をGUI操作で実行可能なものとするか、PythonやRでのプログラミング可能な開発環境を提供するかなど、求める技術レベルに応じて必要となるものを検討し整備していく必要があります。
さらに、自社のシステム部門で対応可能か、ITベンダーを頼るべきかの判断も企業には求められます。