Registration info |
セミナー参加者枠 ¥4000(Pay at the door)
FCFS
|
---|
Description
内容概要
強化学習について勉強したいという話をよく伺うのですが、なかなか推奨できる本が 少ないので、初心者向けのイベントを企画させていただきました。 問題定義としてのマルコフ決定過程(MDP)、ベルマン方程式による価値の計算、 ニューラルネットワークによる価値関数の近似などの理解を通してDeep Q-Network の理解まで繋げられたらと思います。 進行としては前半で仕組みの解説、後半で実装を元にしたハンズオンを行います。 ※ セミナー内容をベースに下記に色々とまとめていますので、こちらも合わせて ご確認いただけると理解が深まるのではないかと思います。 https://note.com/lib_arts/n/n8cf4cbe2dce4
開催日程
1/12(日) 受付: 12:50〜13:00 講義: 13:00〜15:00 ※ 途中5分ほどの休憩を設ける予定です。
アジェンダ
◆ 講義編 系列モデリングとマルコフ決定過程 エージェントと環境 ベルマン方程式による状態や状態における行動の価値の計算 ニューラルネットワークによる状態行動価値関数の近似 Deep Q-Network ◆ 演習編(ハンズオン) OpenAI Gymなどを簡単に動かしてみます。 ◆ 発展編(時間に余裕があれば概要だけお伝えします) Rainbow、Ape-X、R2D2、R2D3
会場
水道橋駅、神保町駅、九段下駅周辺 千代田区西神田2-7-14 YS西神田ビル2F
対象者
・強化学習に興味がある方 ・実際にプログラムを動かしながら概要を掴みたい方 ※ 初心者〜中級者を前提とした進行としますので、極力難しい言葉や数式は使わないで 進行するようにします。
講師プロフィール
東大工学部卒。 データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。 また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。 初心者向けの指導実績も多く、1,500名ほど。
当日までの準備
Python3.6環境でPyTorchとOpenAI Gymが動くようにしてきていただけたらと思います。
費用
4,000円(2h) ※ ・領収書発行の際は事務手数料として追加1,000円のお支払いをよろしくお願いいたします
定員
8名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を反映しません)
ご参加にあたってのお願い
無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので 基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!) 体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、 イベントへのお問い合わせよりご連絡いただけますと嬉しいです。 上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて いただきますので、その点だけ予めご了承ください。 (7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を いただくということだけ気をつけていただければ大丈夫だと思います) モチベーションの高い参加者の方を重視する運営としていきたいと考えています。 ご協力のほど、よろしくお願いいたします。
Media View all Media
If you add event media, up to 3 items will be shown here.