![]() |
【会場受講】第2回【データサイエンス実務入門】Python導入からはじめる!ビジネスデータ分析・WEBスクレイピング |
開催日時 | 2020-09-18(金) 9:30~16:30 |
---|---|
講師 |
DATUM STUDIO株式会社
取締役副社⻑ CAO 里 洋平 氏 R言語の東京コミュニティTokyo.R創立者 ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事 その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立 Pythonデータサイエンスワークショップ講師経験豊富 著書「データサイエンティスト養成読本」(技術評論社)「ビジネス活用事例で学ぶデータサイエンス入門」(ソフトバンククリエイティブ)「Rではじめるビジネス統計分析」(翔泳社) 「戦略的データマイニング (シリーズ Useful R 4)」(共立出版)「Rパッケージガイドブック」(東京図書)「したっぱエンジニア、経営に成功して億万長者になる」(技術評論社)「パーフェクトR」(技術評論社)「改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく!]」(技術評論社) 等 |
補足事項 | ご自身のPCで演習しながら学ぶ体験学習型ワークショップです。ノートPCをご持参ください。 【事前準備について】 ※ インターネットを使用します。Wi-Fi環境をご用意いたしますので、接続可能なPCをご持参ください。 ※ WebブラウザはGoogle Chromeを使用します。開催前日までにご自身のPC(セミナー当日使用するPC)に必ずダウンロードしてください。 ※ 事前配布資料「Google Colaboratory 接続の手順書」を開催1週間前にメール送付します。 ※ Google Colaboratory 環境で実習していただきます。事前に本セミナー専用のGoogle アカウントをご用意ください。詳しくは「Google Colaboratory 接続の手順書」内にてご案内します。 ※ 「Google Colaboratory 接続の手順書」の内容についてはセミナー当日の講義冒頭で簡単に解説しますが、開催前日までにご自身のPC (セミナー当日使用するPC) で本手順書に沿って動作確認をおこなってください。 ※ 前日までに動作確認ができなかった方のために、セミナー当日の9:10から会場にて事前サポートと動作確認のお時間を設けます。ご希望の方はお早めにご来場ください。 ※ 本セミナーではSlack上で質問受付を行います。申込み時に必ずSlackに登録可能なメールアドレスをフォームにご入力ください。開催日1週間前に、ご登録のアドレスをSlackにご招待します。 ※ こちらは会場参加のお申し込みページです。オンライン受講をご希望の方は該当のページよりお申し込みください。 ※ 本セミナーのキャンセル期限は9/11(金)12時です。(開催1週間前に資料の一部を送付するため) ※ 回数券を使用して当セミナーにお申込されます場合、2回分の回数券が必要となります。 ※ 当日は昼食をご用意いたします。 |
概要 | データサイエンス、特に機械学習・ディープラーニングは専門家に留まらず、文系の方々やトップマネジメントを含む、あらゆるビジネスパーソンにとって業務効率改善・生産性向上において必須のツールになりつつあります。今回はAIのビジネス応用で最もポピュラーな機械学習の技術を中心に取り扱い、機械学習の実務者を担うための第1ステップとなることを目的とします。 特別な環境構築が不要なGoogle Colaboratory上でPythonを使用して、データ分析やWEBスクレイピングの基本的な考え方や実装の仕方、実務でよく遭遇する課題へのアプローチの仕方等について、デモ・演習を交えて体験しながら学んでいただきます。それにより、データ分析やWEBスクレイピングの基本概念や実践方法を習得することができます。 担当講師はこれまでPythonやRを中心にゼロからデータサイエンス環境を構築、運用から経営デザインまでを展開する最先端のコミュニティを主催、ワークショップも数多く開催、初学者からエンジニアまでの多くの受講者がつまずきやすく、わかりにくいところについてインタラクティブに進めるワークショップはいつも盛況です。 データ分析やWEBスクレイピングのどの問題設定に取り組む際にもまず、Pythonを用いてのデータの可視化を行い、データを理解することから始めます。「視覚化デモ→演習→基礎理論学習」のサイクルを繰り返すことにより、「体感できた」「使えた」だけで終わることなく「腹落ち」して理解するレベルまでもっていくことができます。この中に「どのようにアプローチすべきか」という観点が入るため、データ分析やWEBスクレイピングについての技術だけでなく実務上の問題に対する思考プロセスも理解することができます。 確率統計やPythonについての事前知識は不要ですが、事前に「参考サイト」など目を通しておくと、学習効果はアップします。 参考サイト:データサイエンス・オンライン講座 - 総務省統計局 https://www.stat.go.jp ■-------------------------------------------------------------■ このセミナーで得られること ・Google Colaboratory(Jupyter Notebook)、Pythonの導入 ・Python文法基礎とデータ処理/統計処理ライブラリの導入 ・ハンドリング ・WEBスクレイピングの基礎 ・データサイエンス実務に必要な最低限の統計処理入門 ・データ可視化によるデータサイエンスの基礎的理解 ・機械学習の触り ■-------------------------------------------------------------■ 本講座の受講に必要な前提知識 本セミナーを受講するにあたり、統計処理やPythonについての事前知識は一切不要ですが、ExcelやBIツール等での基本的なデータ処理操作(表計算や図を挿入してのデータ処理・グラフ化程度)や分析の経験がある方を対象としています。 ■-------------------------------------------------------------■ 事前学習のご案内 Pythonプログラミングやデータ分析について未経験者の方には、本セミナーの受講前に以下のセミナーの受講をおすすめします。 <第1回>9月10日(木)開催セミナー 「【データサイエンス超入門】Excel演習で可視化!仮説思考によるPDCAのすすめ」 ■-------------------------------------------------------------■ セミナー難易度チャート *以下のような方を対象としています* データ分析:★★☆☆☆(学習経験あり) 統計処理・プログラミング:★☆☆☆☆(未経験者OK) 機械学習:★☆☆☆☆(未経験者OK) ビジネス力:★☆☆☆☆(実務未経験者OK) ※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。 |
---|---|
セミナー詳細 |
1.Pythonの基本操作 (1)Google Colaboratory(Jupyter Notebook)導入 (2)Python文法基礎 (3)Pythonデータ処理/統計処理ライブラリ導入:Numpy、pandas、Matplotlib、scikit-learnなど 2.Pythonデータ分析 (1)Excelデータの取り込み (2)ハンドリング基礎:データ統合・分割・可視化基礎 (3)時系列データの取り扱い 3.データマーケティング演習〈前回【データ分析実務】復習を兼ねた応用演習〉 (1)仮説検証のための回帰分析 (2)重回帰 (3)ダミー変数 4.演習しながら学ぶ!必要最低限の統計処理 (1)目的に沿った統計処理の選択 (2)可視化を目指して (3)記述統計処理演習 (a)全体像把握:度数分布とヒストグラム、リスク(標準偏差)とリターン(平均)、正規分布 (b)比較〈3章の話〉:相関、回帰 (4)推測統計処理演習:リアルワールドでの仮説検証 (a)標本調査 (b)推定 (c)仮説検定 5.Pythonで実践!Webスクレイピング (1)Webスクレイピングとは (2)Webスクレイピングを行う上での注意点 (3)Webスクレイピングの基本 (a)ページの取得 (b)ページのDOMツリーの確認 (c)ほしいデータを抽出する 6.Webスクレイピング演習 7.機械学習ことはじめ〈次回【データサイエンス実務基礎】準備を兼ねて〉 (1)機械学習概論 (2)機械学習超入門デモ (a)データ可視化/データ理解 (b)決定木デモ (c)ロジスティック回帰デモ 8.質疑応答 ※ 講義中の録音、ビデオ・写真撮影等はご遠慮ください |
カテゴリ | 技術コース 事業戦略・マーケティング |
---|---|
関連キーワード |
お問い合わせ先 |
株式会社セミナーインフォ TEL : 03-3239-6544 E-mail : customer@seminar-info.jp お問い合わせフォーム |
---|