天堂va欧美ⅴa亚洲va一国产,久久精品国产99久久久古代,国产精品亚洲一区在现观看,欧美性爱专区在线观看

      <legend id="jve7x"></legend>
        <sub id="jve7x"><ol id="jve7x"></ol></sub>

        <sub id="jve7x"></sub>

        88 優(yōu)惠券
        2020年3月1日到期。滿 200 元可用
        立即使用
        立即使用
        • 參會報名
        • 會議通知
        • 會議日程
        • 會議嘉賓
        • 參會指南
        • 手機下單 手機掃碼下單

        首頁 > 培訓(xùn)課程 > IT/技術(shù)培訓(xùn) > 深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班7月 更新時間:2022-07-06T14:11:17

        深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班7月
        收藏3人
        分享到

        深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班7月 已截止報名

        課程時間: 2022-07-30 09:00至 2022-08-01 18:00結(jié)束

        課程地點: 線上活動 

        會議規(guī)模:60人

        主辦單位: 中國人工智能培訓(xùn)網(wǎng) 北京龍騰亞太教育咨詢有限公司

        行業(yè)熱銷熱門關(guān)注看了又看 換一換

              會議通知

              會議內(nèi)容 主辦方介紹


              深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班7月

              深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班7月宣傳圖

              關(guān)于舉辦“深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班”的通知

              各企、事業(yè)單位:

              隨著科技的快速發(fā)展,人工智能儼然成了當(dāng)今社會的關(guān)注焦點。而在人工智能的發(fā)展上,深度學(xué)習(xí)、強化學(xué)習(xí)、遷移學(xué)習(xí)等成為了科學(xué)界、工業(yè)界研究和應(yīng)用的熱點。在實際研究和應(yīng)用過程當(dāng)中,研究人員逐漸發(fā)現(xiàn)了深度學(xué)習(xí)單獨應(yīng)用的缺點,如沒有決策能力,不可推理等。而深度強化學(xué)習(xí),作為一種嶄新的機器學(xué)習(xí)方法,同時具有感知能力和決策能力,它是深度學(xué)習(xí)與強化學(xué)習(xí)的結(jié)合,二者的結(jié)合涵蓋眾多算法、規(guī)則、框架,并廣泛應(yīng)用于機器人、無人機、無人車、無人艇、兵棋推演、自動駕駛、能源分配、編隊控制、航跡規(guī)劃、路由規(guī)劃等眾多領(lǐng)域,具有極高的研究與應(yīng)用價值。

              為積極響應(yīng)科研及工作人員需求,根據(jù)國務(wù)院《國家中長期人才發(fā)展規(guī)劃綱要(2010-2020年)》和人社部《專業(yè)技術(shù)人才知識更新工程實施方案(2010-2020年)》文件精神,中國管理科學(xué)研究院現(xiàn)代教育研究所 聯(lián)合北京龍騰亞太教育咨詢有限公司特舉辦“深度強化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用研修班”。本次培訓(xùn)采用全實戰(zhàn)培訓(xùn)模式。

              主辦單位:中國管理科學(xué)研究院現(xiàn)代教育研究所

              承辦單位:北京龍騰亞太教育咨詢有限公司、北京新鼎聚成文化傳媒有限公司

              注:發(fā)票由具體承辦單位開具。

              一、培訓(xùn)專家:

              中國科學(xué)院計算技術(shù)研究所、清華大學(xué)、北京理工大學(xué)等科研機構(gòu)和大學(xué)的高級專家,擁有豐富的科研及工程技術(shù)經(jīng)驗,長期從事人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)、大數(shù)據(jù)分析等領(lǐng)域的教學(xué)與研究工作。

              二、時間安排: ????????????????2022年7月29日-8月01日 ????線上直播

              ? ? ? ? ? ? ? ? ? ? ? ? ? ?(29日下發(fā)上課所需材料,7月30日-8月1日全天上課)


              中國管理科學(xué)研究院現(xiàn)代教育研究所 ?????????????北京龍騰亞太教育咨詢有限公司

              ??????二〇二二年五月二十八日??????????????????????二〇二二年五月二十八日

              三、參會對象:

              各省市、自治區(qū)從事人工智能、機器學(xué)習(xí)、計算機視覺、自然語言處理、無人機、無人艇、無人車、機器人、智能體、多智能體、兵棋推演、自動駕駛、能源分配、編隊控制、航跡規(guī)劃、路由規(guī)劃等領(lǐng)域相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專院校相關(guān)專業(yè)教學(xué)人員及在校研究生等相關(guān)人員,以及強化學(xué)習(xí)、人工智能廣大愛好者。

              四、培訓(xùn)目標:

              1、了解強化學(xué)習(xí)發(fā)展。

              2、掌握單智能體深度強化學(xué)習(xí)。

              3、掌握多智能體深度強化學(xué)習(xí)。

              4、掌握多任務(wù)深度強化學(xué)習(xí)。

              5、掌握強化學(xué)習(xí)應(yīng)用領(lǐng)域Gym Retro游戲平臺、機器人控制、計算機視覺、自然語言處理。

              6、實現(xiàn)Gym、Ray仿真環(huán)境。

              7、實際體驗Q Learning實驗、DQN實驗、DDPG實驗。

              五、費用標準:

              1、4580元/人(含報名費、培訓(xùn)費、資料費、證書費)。

              2、培訓(xùn)費由組織培訓(xùn)班的施教機構(gòu)負責(zé)收取并提供培訓(xùn)發(fā)票。

              3、報名成功后于一周內(nèi)辦理匯款手續(xù)。

              4、報名5人以上可享受9折優(yōu)惠。

              5、參加線上培訓(xùn)學(xué)員可享受視頻錄播回放權(quán)益,及本人再次免費參加線下學(xué)習(xí)權(quán)益。

              六、頒發(fā)證書:

              參加相關(guān)培訓(xùn)并通過考核的學(xué)員,由中國管理科學(xué)研究院現(xiàn)代教育研究所頒發(fā)《深度強化學(xué)習(xí)開發(fā)與應(yīng)用工程師》(高級)崗位認證證書,可通過官方網(wǎng)站查詢 ,該證書可作為有關(guān)單位專業(yè)技術(shù)人員能力評價、考核和任職的重要依據(jù)。

              注:請學(xué)員將電子版彩照(大于20KB,紅藍底皆可)、身份證復(fù)印件和學(xué)歷證明復(fù)印件?

              七、注意事項

              1、指定報名郵箱?

              2、報名成功后,會務(wù)組在上課前兩天發(fā)放上課所需所有材料。

              3、學(xué)員需自備電腦一臺,配置win10、64位系統(tǒng)、8G內(nèi)存、100G硬盤。

              附件1:具體課程安排

              時間安排

              大 ?綱

              具體內(nèi)容

              實操案例

              三天

              關(guān)鍵點

              1.強化學(xué)習(xí)的發(fā)展歷程

              2.馬爾可夫決策過程

              3.動態(tài)規(guī)劃

              4.無模型預(yù)測學(xué)習(xí)

              5.無模型控制學(xué)習(xí)

              6.價值函數(shù)逼近

              7.策略梯度方法

              8.深度強化學(xué)習(xí)-DQN算法系列

              9.深度策略梯度-DDPG,PPO等

              第一天

              9:00-12:00

              14:00-17:00

              一、強化學(xué)習(xí)概述

              1.強化學(xué)習(xí)介紹???????2.強化學(xué)習(xí)與其它機器學(xué)習(xí)的不同

              3.強化學(xué)習(xí)發(fā)展歷史???4.強化學(xué)習(xí)典型應(yīng)用

              5.強化學(xué)習(xí)基本元素???6.強化學(xué)習(xí)算法分類

              二、馬爾科夫決策過程

              1.馬爾可夫性?????????2.馬爾可夫決策過程

              3.策略與價值?????????4.最優(yōu)化原理

              5.MDPs擴展

              三、動態(tài)規(guī)劃

              1.動態(tài)規(guī)劃???????2.價值迭代

              3.策略迭代???????4.迭代策略評估

              5.廣義策略迭代???6.維數(shù)災(zāi)

              1.python環(huán)境下簡單掃地機器人環(huán)境

              2.價值迭代python實現(xiàn)

              3.策略迭代python實現(xiàn)

              4.迭代策略評估python實現(xiàn)

              四、無模型預(yù)測學(xué)習(xí)

              1.蒙特卡洛方法???2.時間差分學(xué)習(xí)

              3.n-步回報???????4.TD(lambda)

              5.資格跡

              1.蒙特卡洛方法python實現(xiàn)

              2.時間差分方法python實現(xiàn)

              第二天

              9:00-12:00

              14:00-17:00

              、無模型控制學(xué)習(xí)

              1.蒙特卡洛控制???2.Sarsa

              3.重要性采樣?????4.Q-學(xué)習(xí)

              4.Double Q學(xué)習(xí)???5.探索與利用

              1. Sarsa方法python實現(xiàn)

              2. Q學(xué)習(xí)方法python實現(xiàn)

              3. Sarsa(lambda)方法python實現(xiàn)

              六、價值函數(shù)逼近

              1.函數(shù)逼近器?????2.線性函數(shù)逼近

              3.常見的特征表示方法

              4.價值迭代+離散化方法

              5.Fitted Q Iteration

              6.策略迭代+最小二乘

              7.預(yù)測學(xué)習(xí)+隨機梯度下降法

              8.控制學(xué)習(xí)+隨機梯度下降法

              1. 離散化Q迭代方法python實現(xiàn)

              2. LSPI方法python實現(xiàn)

              、策略梯度方法

              1.基于策略的強化學(xué)習(xí)

              2.有限差分策略梯度

              3.解析法策略梯度

              4.REINFORCE算法

              5.Actor-Critic

              6.策略梯度引入基準

              7.自然梯度

              8.確定型Actor-Critic

              1. 策略迭代方法python實現(xiàn)

              2. actor-critic方法python實現(xiàn)

              第三天

              9:00-12:00

              14:00-17:00

              、深度強化學(xué)習(xí)

              1.Deep?Q learning(DQN)

              2.Double DQN

              3.Dueling DQN

              4.Prioritized Experience Replay

              5.A3C/A2C

              6.DDPG

              7.PPO

              8.SAC

              1.深度強化學(xué)習(xí)訓(xùn)練場-OpenAI Gym?安裝與使用

              2.Pytorch安裝與使用

              3.自動駕駛賽車任務(wù)

              4.月球飛船降落任務(wù)

              實操解析與訓(xùn)練一

              實驗:倒立擺和冰壺控制實踐

              1.環(huán)境編寫 ???2.算法設(shè)計 ???3.實驗結(jié)果

              高頻問題:

              如何將一個控制問題設(shè)計成馬爾可夫決策問題并使用強化學(xué)習(xí)算法進行訓(xùn)練

              關(guān)鍵點:

              1.基于模型的離線強化學(xué)習(xí)方法 ???2.基于數(shù)據(jù)的在線強化學(xué)習(xí)方法

              實操解析與訓(xùn)練二

              實驗:OpenAI Gym實踐

              1.Gym安裝 ??2.Gym使用 ??3.強化學(xué)習(xí)

              高頻問題:

              1.如何基于Gym實現(xiàn)強化學(xué)習(xí)訓(xùn)練與測試

              關(guān)鍵點:

              1.掌握馬爾可夫決策過程 ??????2.低維輸入的強化學(xué)習(xí)方法

              實操解析與訓(xùn)練三

              實驗:月球飛船降落任務(wù)

              1.DQN/Double?DQN/Dueling?DQN????????2.PER

              高頻問題

              1.深度強化學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練穩(wěn)定性 ??2.探索與利用

              關(guān)鍵點:

              1.經(jīng)驗回放技術(shù)的實現(xiàn) ????2.目標網(wǎng)絡(luò)更新

              實操解析與訓(xùn)練四

              實驗:自動駕駛賽車任務(wù)

              1.連續(xù)控制任務(wù) ??2.策略梯度方法DDPG/PPO

              高頻問題:

              1.適用于高維輸入的連續(xù)控制任務(wù)的深度強化學(xué)習(xí)方法

              關(guān)鍵點:

              1.掌握DDPG和PPO具體編程實現(xiàn) ???

              2.根據(jù)實際需求,選用合理的深度強化學(xué)習(xí)方法


              ?



              查看更多

              會議日程


              即將更新,敬請期待

              會議嘉賓


              即將更新,敬請期待

              參會指南

              會議門票


              票種名稱 價格 原價 票價說明
              早鳥價 ¥4580 ¥4580 講課費,資料費,證書費,平臺費,售后服務(wù)費

              查看更多

              溫馨提示
              酒店與住宿: 為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認參會信息后,再安排出行與住宿。
              退款規(guī)則: 活動各項資源需提前采購,購票后不支持退款,可以換人參加。

              還有若干場即將舉行的 深度學(xué)習(xí)大會

              猜你喜歡

              部分參會單位

              主辦方?jīng)]有公開參會單位
              活動家_小程序快捷下單

              微信掃一掃
              分享給朋友

              郵件提醒通知

              分享到微信 ×

              打開微信,點擊底部的“發(fā)現(xiàn)”,
              使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

              錄入信息

              請錄入信息,方便生成邀請函