【会場受講】第2回【データサイエンス実務基礎】Pythonで体感!はじめての機械学習≪前編≫ ~可視化&演習しながら学ぶ機械学習モデリングの基礎~ |
受講区分 | 会場 |
---|---|
開催日時 | 2021-05-07(金) 9:30~16:30 |
講師 |
セカンドサイト株式会社 栢本 淳一 氏 執行役員 奥澤 創一郎 氏 マネジャー
【栢本 淳一 氏】 |
開催地 | カンファレンスルーム(株式会社セミナーインフォ内) |
概要 | データサイエンス、特に機械学習・ディープラーニングはデータ分析・AIの専門家に留まらず、文系の方々やトップマネジメントを含む、あらゆる業種のビジネスパーソンにとって業務効率改善・生産性向上において必須のツールになりつつあります。その中でも、今回はAIのビジネス応用で最もポピュラーな機械学習の技術を中心に取り扱い、機械学習の実務者を担うための第1ステップとなることを目的とします。 特別な環境構築が不要なGoogle Colaboratory(※)を利用し、いきなりデータサイエンス実務のトレーニングに入れます。(※Google Colaboratoryは機械学習・データ分析の自動化とその効率化を主目的に開発されたツールです。本セミナーでは主にJupyter Notebook環境を使います。) Google Colaboratory上でPythonを使用して、機械学習手法の基本的な考え方や実装の仕方、実務でよく遭遇する課題へのアプローチの仕方等について、デモ・演習を交えて体験しながら学んでいただきます。それにより、機械学習の基本概念や実践方法を習得することができます。 担当講師はこれまでアナリティクス技術を活用した金融のマーケティング、リスク管理等の案件に従事し、機械学習モデルの構築・導入支援業務を推進しております。 機械学習のどの問題設定に取り組む際にもまず、Pythonを用いてのデータの可視化を行い、データを理解することから始めます。「視覚化デモ→演習→基礎理論学習」のサイクルを繰り返すことにより、「体感できた」「使えた」だけで終わることなく「腹落ち」して理解するレベルまでもっていくことができます。この中に「どのようにアプローチすべきか」という観点が入るため、機械学習についての技術だけでなく実務上の問題に対する思考プロセスも理解することができます。また、本セミナーで修得した技術・知識は更に高度なディープラーニング技術修得の際の最重要な基礎になります。 ■-------------------------------------------------------------■ このセミナーで得られること ・機械学習に関する基本的な知見と実用化事例 ・機械学習ライブラリの導入 ・機械学習プログラミング ・データ予測基礎 ・ディープラーニングの触り ■-------------------------------------------------------------■ 本講座の受講に必要な前提知識 ・Google Colaboratory(Jupyter Notebook)/Python/データ処理ライブラリの導入 ・Pythonでの基本的なデータ処理操作経験 ・Pythonでの基本的な単回帰分析操作経験 ・Pythonでの基本的なデータハンドリング経験 ■-------------------------------------------------------------■ 事前学習について Pythonプログラミングやデータ分析について未経験者の方は、本セミナーの受講前に4/13(火)開催 第1回セミナーの受講をおすすめします。 ■-------------------------------------------------------------■ セミナー難易度チャート *以下のような方を対象としています* データ分析:★★☆☆☆(学習経験あり) 統計処理・プログラミング:★★☆☆☆(学習経験あり) 機械学習:★☆☆☆☆(未経験者OK) ビジネス力:★☆☆☆☆(実務未経験者OK) ※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。 |
詳細 |
1.プログラミング基礎確認:第1回のおさらい&準備 (1)機械学習ライブラリ入門 (a)Numpy、pandas、Matplotlib、scikit-learnなど (2)データハンドリング (3)グラフ描画 (4)データクレンジング (5)スクレイピング 2.機械学習ハンズオン【1】 (1)背景にある統計処理の考え方・使い方 (a)「損失関数」を決める (b)損失関数を「最小化」する (2)回帰分析の実装 (a)実データに対する重回帰モデルの実装 (b)実データで演習 (3)外れ値を考慮した実装・外れ値除去 (a)正規分布と3σ法 (b)スケーリング (c)スケーリングとパラメータの確認 3.機械学習ハンズオン【2】 (1)EDA(探索的データ解析) (a)DataFrameで行列データを眺める (b)Matplotlibでグラフ化したデータを眺める (2)特徴量設計 (a)数値変数の扱い (b)カテゴリ変数の扱い (c)日付・時刻変数の扱い (3)基礎的なモデルの利用 (a)決定木 (b)ロジスティック回帰 (4)高度なモデルの利用 (a)勾配ブースティング (b)ニューラルネットワーク (5)モデルの評価・比較 4.時系列・テキストデータ分析入門デモ(次回の予習) (1)時系列データ分析 (2)テキストデータ分析 5.質疑応答 ※ 録音、ビデオ・写真撮影等はご遠慮ください |
お問合わせ |
株式会社セミナーインフォ セミナー運営事務局 TEL : 03-3239-6544 FAX : 03-3239-6545 E-mail : customer@seminar-info.jp |