〈2日間開催〉【AIデータエンジニアリング実務・基礎編】 KaggleMasterによるPython機械学習・アルゴリズム・ワークショップ |
受講区分 | 会場 |
---|---|
開催日時 | 1日目 2020-02-03(月) 9:15~16:15 2日目 2020-02-17(月) 9:15~16:15 |
講師 |
佐野 遼太郎 氏 Kaggle Master
2015年4月よりコンサルタントとして金融機関を中心としたデータ分析・モデル構築業務に従事 18年2月にKaggler枠で株式会社ディー・エヌ・エーに入社、現在に至る また、16年から社外データ分析講座講師として300人を超えるデータ分析技術者の人材育成に関わっている |
開催地 | カンファレンスルーム(株式会社セミナーインフォ内) |
概要 | この講座では短時間で知識を詰め込むのでなく、実際に業務で使うデータ分析技術について四苦八苦しながら学びます。第1回と第2回の間には各自プライベートの時間を削って宿題を行うことを想定としています さらに第2回の終了後もプライベートの時間を削って復習することを想定しています。手を動かしてデータ分析を学びたい方、数式にアレルギーがない方、必見です。 この講座で得られること ・データを見る力(泥臭いデータ分析力) ・決定木、ロジスティック回帰の得手不得手の理解と、実装 ・過学習を防いでのパラメータチューニング ・リークについて ・予測モデルのビジネス応用時の注意点 ・特徴量作成 ・データの可視化 |
詳細 |
【第1日目】 株式会社SIGNATE様(国内コンペサイト)の練習問題を用いて、実際にコンペに取り組みながら予測モデルの作成と改良、リークとビジネス応用時の注意点について学んでいきます。 扱う問題は2値分類です。 ※株式会社SIGNATE様には、営利目的でのコンペ利用許可を得ています 1.モデルの精度評価 (1)ROC曲線とAUC 2.データを眺める (1)Pandas、Seabornによるデータの眺め方 (2)演習 3.決定木 (1)決定木の概要 (2)決定木の得手不得手 (3)演習 (4)初サブミット(投稿) 4.過学習 (1)過学習について (2)ホールドアウト法 (3)クロスバリデーション法 (4)演習 5.質疑応答 ※ 録音、ビデオ・写真撮影はご遠慮ください ※ 質疑応答は適宜設けます 【第2日目】 株式会社SIGNATE様(国内コンペサイト)の練習問題を用いて、実際にコンペに取り組みながら予測モデルの作成と改良、リークとビジネス応用時の注意点について学んでいきます。 扱う問題は2値分類です。 ※株式会社SIGNATE様には、営利目的でのコンペ利用許可を得ています 1.ロジスティック回帰 (1)ロジスティック回帰の概要 (2)線形モデルに対する変数加工 (3)ロジスティック回帰の得手不得手 (4)演習 (5)サブミット(投稿) 2.アンサンブル学習(平均のみ) (1)平均によるアンサンブル学習 (2)サブミット(投稿) 3.まとめ (1)演習(精度向上への取り組み) (2)講座参加者が、各自の取り組みについて発表 4.リークとビジネス応用での注意点 (1)リークについて (2)ビジネス応用での注意点 (3)ROC曲線の使い方 5.復習 (1)疑問点の解消と演習(総復習と精度向上) 6.質疑応答 ※ 録音、ビデオ・写真撮影はご遠慮ください ※ 質疑応答は適宜設けます |
お問合わせ |
株式会社セミナーインフォ セミナー運営事務局 TEL : 03-3239-6544 FAX : 03-3239-6545 E-mail : customer@seminar-info.jp |