【会場受講限定】第4回【2日間開催】【データサイエンス・ヘルスケア編】リアル医療データを用いたPython予測モデリングの実践

受講区分 会場
開催日時 1日目 2021-11-05(金) 9:30~12:30
2日目 2021-11-26(金) 9:30~12:30
講師 株式会社JMDC データ・イノベーション・ラボ
北野 道春 氏
齋藤 知輝 氏

【北野 道春 氏】
データサイエンティスト協会 スキル定義委員
同志社大学大学院 文化情報学研究科修了 前職の大手証券会社グループにて、機械学習、自然言語処理などの技術を用いた株価予測モデル、リテール向け投信購買予測モデルなどを担当 株式会社JMDC入社後は、ヘルスケアビッグデータを用いた保険支払査定モデルの開発やウェアラブルデータの分析等に従事

【齋藤 知輝 氏】
日本アクチュアリー会正会員 Kaggle Competitions Expert
東京大学工学部計数工学科卒業、日本生命保険相互会社で商品開発業務等を担当した後、2018年より現職 日本最大級のリアル医療データを用いた生活習慣病の疾病リスク予測モデルの開発等に従事

開催地 カンファレンスルーム(株式会社セミナーインフォ内)
概要 過去の受講者満足度100%の高評価セミナーをアップデートしてお届けします。

【1日目】課題設定とモデリングの流れ

今回扱うリアル医療データ・モデリング課題の背景についてご説明した後、実際のモデリングの基本的な流れをコードデモ形式で解説します。
そして1日目の内容を踏まえ、2日目までに各自でモデルをブラッシュアップしていただきます。作成いただいたモデルの予測結果は2日目までに送付いただきます。
※扱う問題は不均衡データに対する2値分類です。

【2日目】モデリングの振り返りとビジネスへの応用

参加者方の取組結果について、簡単な発表も通じて知見を深めあっていただきます。
その後講師のモデリングコードを題材に課題の解説を行います。
また、ビジネスの場面で予測性能に劣らず重視される予測モデルの解釈について、講師の実体験に基づく様々なアプローチ事例をご紹介します。

■-------------------------------------------------------------■
このセミナーで得られること
・リアルデータを題材としたデータサイエンスの実践体験
・EDAからモデル構築・性能評価にいたるデータサイエンスのスキル全般
■-------------------------------------------------------------■
本講座の受講に必要な前提知識
・Google Colaboratory(Jupyter Notebook) の操作経験
・Python(Pandas、Matplotlib)を用いた基本的なデータ処理・可視化の実装経験
■-------------------------------------------------------------■
事前学習について
・Pythonプログラミングの未経験者の方は、本セミナーの受講前に9/21(火)開催 第1回セミナー、10/8(金)開催 第2回セミナー、10/22(金)開催 第3回セミナーの受講をおすすめします。
・機械学習及び深層学習の未経験者の方は、本セミナーの受講前に10/8(金)開催 第2回セミナー、10/22(金)開催 第3回セミナーの受講をおすすめします。
■-------------------------------------------------------------■
セミナー難易度チャート *以下のような方を対象としています*
データ分析:★★☆☆☆(学習経験あり)
統計処理・プログラミング:★★☆☆☆(学習経験あり)
機械学習:★★☆☆☆(学習経験あり)
ビジネス力:★★★☆☆(実務経験2年目~)
※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。
詳細 【1日目】課題設定とモデリングの流れ

1.データの理解と課題設定
(1)保有データの理解
(2)ビジネスでの活用を意識した課題設定

2.不均衡データに対する評価指標の設定
(1)不均衡データに対するモデル性能評価の留意点
(2)ROC曲線とAUC
(3)その他の指標(logloss等)

3.探索的データ分析(EDA)
(1)探索的データ分析(要約統計量の算出、様々な可視化)

4.モデル構築と性能評価
(1)過学習とクロスバリデーション
(2)ロジスティック回帰モデル
(3)ランダムフォレスト
(4)GBDT(XGBoost)

5.質疑応答 ※ 講義中の録音、ビデオ・写真撮影等はご遠慮ください。


【2日目】モデリングの振り返りとビジネスへの応用

1.参加者取組発表
(1)保有データの理解
(2)ビジネスでの活用を意識した課題設定

2.講師モデリングコードの解説
(1)講師モデリングコードの解説

3.予測モデルの解釈
(1)データサイエンティスト視点でのモデル解釈
(2)ドメイン知識(今回は医学的視点)に基づくモデル解釈
(3)データサイエンス部門以外の方への説明

4.質疑応答 ※ 講義中の録音、ビデオ・写真撮影等はご遠慮ください。
お問合わせ 株式会社セミナーインフォ  セミナー運営事務局
TEL : 03-3239-6544   FAX : 03-3239-6545   E-mail : customer@seminar-info.jp