【会場受講】第2回【データサイエンス実務基礎】Pythonで体感!はじめての機械学習 ~可視化&演習しながら学ぶ基本モデルと非線形、時系列データ対応まで~ |
受講区分 | 会場 |
---|---|
開催日時 | 2020-07-29(水) 9:30~16:30 |
講師 |
セカンドサイト株式会社 高山 博和 氏 代表取締役CEO 兼 CAO 奥澤 創一郎 氏 マネジャー
【高山 博和 氏】 |
開催地 | カンファレンスルーム(株式会社セミナーインフォ内) |
概要 | データサイエンス、特に機械学習・ディープラーニングはデータ分析・AIの専門家に留まらず、文系の方々やトップマネジメントを含む、あらゆる業種のビジネスパーソンにとって業務効率改善・生産性向上において必須のツールになりつつあります。その中でも、今回はAIのビジネス応用で最もポピュラーな機械学習の技術を中心に取り扱い、機械学習の実務者を担うための第1ステップとなることを目的とします。 特別な環境構築が不要なGoogle Colaboratory(※)を利用し、いきなりデータサイエンス実務のトレーニングに入れます。(※Google Colaboratoryは機械学習・データ分析の自動化とその効率化を主目的に開発されたツールです。本セミナーでは主にJupyter Notebook環境を使います。) Google Colaboratory上でPythonを使用して、機械学習手法の基本的な考え方や実装の仕方、実務でよく遭遇する課題へのアプローチの仕方等について、デモ・演習を交えて体験しながら学んでいただきます。それにより、機械学習の基本概念や実践方法を習得することができます。 担当講師はこれまでアナリティクス技術を活用した金融のマーケティング、リスク管理等の案件に従事し、機械学習モデルの構築・導入支援業務を推進しております。 機械学習のどの問題設定に取り組む際にもまず、Pythonを用いてのデータの可視化を行い、データを理解することから始めます。「視覚化デモ→演習→基礎理論学習」のサイクルを繰り返すことにより、「体感できた」「使えた」だけで終わることなく「腹落ち」して理解するレベルまでもっていくことができます。この中に「どのようにアプローチすべきか」という観点が入るため、機械学習についての技術だけでなく実務上の問題に対する思考プロセスも理解することができます。 また、本セミナーで修得した技術・知識は更に高度なディープラーニング技術修得の際の最重要な基礎になります。 ■-------------------------------------------------------------■ このセミナーで得られること ・機械学習に関する基本的な知見と実用化事例 ・機械学習ライブラリーの導入 ・機械学習プログラミング ・データ予測基礎 ・ディープラーニングの触り ■-------------------------------------------------------------■ 本講座の受講に必要な前提知識 ・Google Colaboratory(Jupyter Notebook)/Python/データ処理ライブラリーの導入 ・Pythonでの基本的なデータ処理操作経験 ・Pythonでの基本的な単回帰分析操作経験 ・Pythonでの基本的なデータハンドリング経験 ■-------------------------------------------------------------■ 事前学習について Pythonプログラミングやデータ分析について未経験者の方は、本セミナーの受講前に 7月16日(木)開催 「【データサイエンス実務入門】Python導入からはじめる!ビジネスデータ分析・スクレイピング・テキストマイニング」 の受講をおすすめします。 ■-------------------------------------------------------------■ セミナー難易度チャート *以下のような方を対象としています* データ分析:★★☆☆☆(学習経験あり) 統計処理・プログラミング:★★☆☆☆(学習経験あり) 機械学習:★☆☆☆☆(未経験者OK) ビジネス力:★☆☆☆☆(実務未経験者OK) ※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。 |
詳細 |
1.プログラミング基礎確認:第1回のおさらい&準備 (1)機械学習ライブラリー入門 (a)Numpy、pandas、Matplotlib、scikit-learnなど (2)データハンドリング (3)グラフ描画 (4)スクレイピング (5)テキストマイニング (6)線形回帰分析 2.機械学習ハンズオン【1】 (1)事例でデータ可視化/データ理解 (a)DataFrameで行列データを眺める (b)Matplotlibでグラフ化したデータを眺める (2)特徴量設計 (a)数値変数の扱い (b)カテゴリ変数の扱い (c)日付・時刻変数の扱い (3)基礎的なモデルの利用 (a)決定木 (b)ロジスティック回帰 (4)高度なモデルの利用 (a)勾配ブースティング (b)ニューラルネットワーク (5)モデルの評価・比較 3.機械学習ハンズオン【2】 (1)よくある落とし穴 (a)データの偏り (b)過学習 (c)リークなど (2)非線形データの扱い方 (3)時系列データの扱い方 (a)時系列データのクラスタリング (b)時系列データの予測 4.ディープラーニング超入門事例デモ(次回の予習) (1)ディープラーニング概論 5.質疑応答 ※ 録音、ビデオ・写真撮影等はご遠慮ください |
お問合わせ |
株式会社セミナーインフォ セミナー運営事務局 TEL : 03-3239-6544 FAX : 03-3239-6545 E-mail : customer@seminar-info.jp |