【DOKODEMO】第3回【データサイエンス実務基礎】Pythonで体感!はじめての機械学習 ~可視化&演習しながら、主要モデルから非線形、ネットワーク分析、時系列データ分析まで~ |
受講区分 | オンライン |
---|---|
開催日時 | 2020-09-25(金) 9:30~16:30 |
講師 |
DATUM STUDIO株式会社 取締役副社⻑ CAO 里 洋平 氏 R言語の東京コミュニティTokyo.R創立者 ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事 その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立 Pythonデータサイエンスワークショップ講師経験豊富 著書「データサイエンティスト養成読本」(技術評論社)「ビジネス活用事例で学ぶデータサイエンス入門」(ソフトバンククリエイティブ)「Rではじめるビジネス統計分析」(翔泳社) 「戦略的データマイニング (シリーズ Useful R 4)」(共立出版)「Rパッケージガイドブック」(東京図書)「したっぱエンジニア、経営に成功して億万長者になる」(技術評論社)「パーフェクトR」(技術評論社)「改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく!]」(技術評論社) 等 |
概要 | 昨今、画像認識、自然言語処理等、非構造化データ解析において人間の性能を凌駕する時代となりました。ビジネスの世界でも従来の手法と異なる、データドリブンによる経営/マーケティング/商品開発/事業創出/与信管理が注目されています。今回はAIのビジネス応用で最もポピュラーな機械学習の技術を中心に取り扱い、機械学習の実務者を担うための第1ステップとなることを目的とします。 特別な環境構築が不要なGoogle Colaboratory上でPythonを使用して、機械学習手法の基本的な考え方や実装の仕方、実務でよく遭遇する課題へのアプローチの仕方等について、デモ・演習を交えて体験しながら学んでいただきます。それにより、機械学習の基本概念や実践方法を習得することができます。 機械学習のどの問題設定に取り組む際にもまず、Pythonを用いてのデータの可視化を行い、データを理解することから始めます。「視覚化デモ→演習→基礎理論学習」のサイクルを繰り返すことにより、「体感できた」「使えた」だけで終わることなく「腹落ち」して理解するレベルまでもっていくことができます。この中に「どのようにアプローチすべきか」という観点が入るため、機械学習についての技術だけでなく実務上の問題に対する思考プロセスも理解することができます。また、本セミナーで修得した技術・知識は更にエンジニア向け機械学習アルゴリズムや高度なディープラーニング技術修得の際の最重要な基礎になります。 確率統計やPythonについての事前知識は不要ですが、事前に「参考サイト」など目を通しておくと、学習効果はアップします。 参考サイト:データサイエンス・オンライン講座 - 総務省統計局 https://www.stat.go.jp ■-------------------------------------------------------------■ このセミナーで得られること ・機械学習に関する基本的な知見と実用化事例 ・機械学習ライブラリーの導入 ・機械学習プログラミング入門 ・データ予測基礎 ・ディープラーニングの触り ■-------------------------------------------------------------■ 本講座の受講に必要な前提知識 ・Google Colaboratory(Jupyter Notebook)/Python/データ処理ライブラリーの導入 ・Pythonでの基本的なデータ処理・統計処理操作経験 ・Pythonでの基本的な単回帰分析操作経験 ・Pythonでの基本的なデータハンドリング経験 ■-------------------------------------------------------------■ 事前学習のご案内 Pythonプログラミングやデータ分析・統計処理について未経験者の方は、本セミナーの受講前に以下のセミナーの受講をおすすめします。 <第2回>9月18日(金)開催セミナー 「【データサイエンス実務入門】Python導入からはじめる!ビジネスデータ分析・スクレイピング」 ■-------------------------------------------------------------■ セミナー難易度チャート *以下のような方を対象としています* データ分析:★★★☆☆(実務~1年) 統計処理・プログラミング:★★☆☆☆(学習経験あり) 機械学習:★☆☆☆☆(未経験者OK) ビジネス力:★☆☆☆☆(実務未経験者OK) ※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。 |
詳細 |
1.機械学習概論と流れ 2.プログラミング基礎〈前回【データサイエンス実務入門】復習を兼ねた応用演習〉 (1)機械学習ライブラリ入門:Numpy、pandas、Matplotlib、scikit-learn等 (2)演習 (a)データハンドリング・グラフ描画 (b)スクレイピング (c)線形回帰分析 (d)データ可視化/データ理解 ・DataFrameで行列データを眺める ・Matplotlibでグラフ化したデータを眺める (e)特徴量設計 ・数値変数の扱い ・カテゴリ変数の扱い ・日付・時刻変数の扱い 3.教師あり学習ハンズオン:実データに対する分析の実装 (1)線形回帰モデル (2)ロジスティック回帰モデル (3)サポートベクターマシン (4)ランダムフォレスト (5)勾配ブースティング (6)ニューラルネットワーク (7)モデルの評価・比較 (8)演習 4.教師なし学習ハンズオン:実データに対する分析の実装 (1)次元削減 (2)クラスタリング (3)異常検知 5.深層学習ことはじめ〈次回【データサイエンス実務応用】準備を兼ねて〉 (1)深層学習概論 (2)深層学習入門デモ (a)DNN(Deep Neural Network)デモ (b)CNN(Convolutional Neural Network)デモ 6.質疑応答 ※ 講義中の録音、ビデオ・写真撮影等はご遠慮ください |
お問合わせ |
株式会社セミナーインフォ セミナー運営事務局 TEL : 03-3239-6544 FAX : 03-3239-6545 E-mail : customer@seminar-info.jp |