ぐぬぬ Python

日々の記録。主に、Python の学習記録。

スキルチェックリスト

f:id:tamoge:20170828142537p:plain

そうだ、データサイエンティストになろう!

背景

下記を目的としたデータサイエンティスト協会という組織があり、

分析技術認定(レベル認定)などの活動を通じて、分析能力の向上を図るための提言や協力を惜しまない支援機関として、高度人材の育成とデータ分析業界の健全な発展に貢献する。

データサイエンティストに必要と思われるスキルを定義したスキルチェックリストを作成・公開している。(現在ver 2.0.0) このリストを元に学習を進めれば、基礎的な部分は抑えられそう。

リストの概要

スキルカテゴリー

カテゴリー、大きく三つに分かれている。 (詳細はおいおい触れていきます)

  • ビジネス力(100項目): 論理的思考、プロジェクトプロセス系
  • データサイエンス力(228項目): 統計数理基礎、分析手法系
  • データエンジニアリング力(129項目): データ加工、分析環境構築系
category sub_category items
ビジネス力 行動規範 12
論理的思考 18
プロジェクトプロセス 20
データ入手 4
データの理解・検証 3
意味合いの抽出、洞察 5
解決 4
事業に実装する 8
活動マネジメント 20
知財 6
category sub_category items sub_category items
サイエンス力 統計数理基礎 16 意味合いの抽出、洞察 4
予測 17 機械学習 20
検定/判断 11 時系列分析 7
グルーピング 14 言語処理 13
性質・関係性の把握 14 画像・動画処理 8
サンプリング 5 音声/音楽処理 5
データ加工 8 パターン発見 3
データ可視化 37 グラフィカルモデル 3
分析プロセス 5 シミュレーション/データ同化 5
データの理解・検証 23 最適化 10
category sub_category items
データエンジニアリング力 環境構築 21
データ収集 16
データ構造 11
データ蓄積 17
データ加工 13
データ共有 14
プログラミング 22
ITセキュリティ 15

今の自分に一番必要なのは「データサイエンス力」なので、ここから手を付けたい。 228項目って多いなー。

スキルレベル

カテゴリー内の各項目ごとに難易度と判定基準が設定されている。

スキルレベル 難易度 判定基準
Senior Data Scientist(業界を代表するレベル) ★★★★ -
Full Data Scientist(棟梁レベル) ★★★ ★★★項目のうち、50%を満たしている。
Associate Data Scientist(独り立ちレベル) ★★ ★★項目のうち、60%を満たしている。
Assistant Data Scientist(見習いレベル) ★項目のうち、70%を満たしている。

まずは、★1つを全部クリアできるようになりたい。見習いレベル!

まとめ

  • データサイエンティスト協会が作成・公開している、スキルチェックリストがある。
  • リストの中のデータサイエンス力★から順番に取組む。