時間:2021年08月05日 分類:技巧指導(dǎo) 次數(shù):
任何專業(yè)論文發(fā)表,參考文獻(xiàn)都是至關(guān)重要的,強(qiáng)化學(xué)習(xí)論文也是如此,為此學(xué)術(shù)顧問在這里分享了一些強(qiáng)化學(xué)習(xí)方面的論文文獻(xiàn),發(fā)表論文人員可作為參考:
面向城市自適應(yīng)交通信號控制的強(qiáng)化學(xué)習(xí)方法研究
由于城市交通的迅速發(fā)展,城市道路功能增多,密度加大,國外從20世紀(jì)60年代便開始了自適應(yīng)交通信號控制的研究.自適應(yīng)交通信號控制是緩解城市交通擁擠的很有潛力的方法...
夏新海 - 被引量: 9 - 2013年
來源: 知網(wǎng)
基于強(qiáng)化學(xué)習(xí)模型的科技用戶學(xué)習(xí)機(jī)制研究
本論文為國家自然科學(xué)基金項(xiàng)目“數(shù)據(jù)庫網(wǎng)站用戶信息搜索中的學(xué)習(xí)行為研究”(編號:70773054)的一個子課題,核心任務(wù)在于通過強(qiáng)化學(xué)習(xí)模型的擬合實(shí)驗(yàn)研究來挖掘科技文...
賀娟 - 南京理工大學(xué) - 被引量: 3 - 2008年
多智能體強(qiáng)化學(xué)習(xí)研究
算法的異步變體.然后將其應(yīng)用到異步強(qiáng)化學(xué)習(xí)算法中,提出了一種新的名為基于反向Q學(xué)習(xí)的Sarsa算法和異步粒子群優(yōu)化算法(APSO-BQSA)的異步強(qiáng)化學(xué)習(xí)算法.最后,通過實(shí)驗(yàn)驗(yàn)證了本文提出的異步PSO和APSO-BQSA算法的有效性.該論文有圖19幅,表7個,參考文獻(xiàn)...
杜威 - 被引量: 0 - 2020年
來源: 萬方 / 知網(wǎng)
基于強(qiáng)化學(xué)習(xí)的倒立擺控制
70年代以來,人們探索不同的學(xué)習(xí)策略和學(xué)習(xí)方法,且在本階段已開始把學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合起來,并取得很大的成功,促進(jìn)機(jī)器學(xué)習(xí)的發(fā)展.1980年,在美國的卡內(nèi)基—梅隆...
張慧 - 被引量: 4 - 2004年
樂學(xué)與學(xué)習(xí)目標(biāo)、強(qiáng)化學(xué)習(xí)的綜述性研究
本論文以文獻(xiàn)法為主要研究方法,通過對近幾年關(guān)于中小學(xué)生教學(xué)模式研究的相關(guān)論文的分析和整理,以提高學(xué)生學(xué)習(xí)動機(jī)為出發(fā)點(diǎn),從教學(xué)理念、課程設(shè)置、教學(xué)活動及教學(xué)...
齊新悅 - 被引量: 0 - 2018年
大學(xué)生使用文獻(xiàn)數(shù)據(jù)庫中的強(qiáng)化學(xué)習(xí)行為實(shí)驗(yàn)分析
研究基于人機(jī)交互環(huán)境下的用戶自己摸索學(xué)習(xí)檢索知識的行為機(jī)理,對于網(wǎng)絡(luò)平臺建設(shè)的有效性提供理論保障.本文首先分析了強(qiáng)化學(xué)習(xí)特征,并選擇了強(qiáng)化學(xué)習(xí)模型中的Bush-...
白晨 , 李丹丹 - 海峽兩岸圖書資訊學(xué)學(xué)術(shù)研討會 - 被引量: 0
來源: 萬方
基于強(qiáng)化學(xué)習(xí)模型的科技文獻(xiàn)數(shù)據(jù)庫用戶學(xué)習(xí)行為研究
將心理學(xué),經(jīng)濟(jì)學(xué)中研究的強(qiáng)化學(xué)習(xí)模型應(yīng)用于科技用戶對檢索方法學(xué)習(xí)的行為研究中,介紹兩個經(jīng)典強(qiáng)化學(xué)習(xí)模型Bush-Mosteller模型和Brgers-Sarin模型;對科技用戶信...
白晨 , 甘利人 - 《數(shù)據(jù)分析與知識發(fā)現(xiàn)》 - 被引量: 4 - 2009年
來源: 維普網(wǎng) / 萬方 / 知網(wǎng) / OALib / manu44.magtech.com...
基于強(qiáng)化學(xué)習(xí)模型的科技文獻(xiàn)數(shù)據(jù)庫用戶學(xué)習(xí)行為研究*
將心理學(xué),經(jīng)濟(jì)學(xué)中研究的強(qiáng)化學(xué)習(xí)模型應(yīng)用于科技用戶對檢索方法學(xué)習(xí)的行為研究中,介紹兩個經(jīng)典強(qiáng)化學(xué)習(xí)模型Bush-Mosteller模型和Brgers-Sarin 模型;對科技用戶信息...
白晨 , 甘利人 - 《數(shù)據(jù)分析與知識發(fā)現(xiàn)》 - 被引量: 0 - 2009年
基于強(qiáng)化學(xué)習(xí)的無線網(wǎng)絡(luò)自組織性研究
傳統(tǒng)無線通信技術(shù)逐漸無法滿足5G通信系統(tǒng)中日益復(fù)雜的需求,而無線自組織網(wǎng)絡(luò)(self-organizing network,SON)相關(guān)技術(shù)的引入為5G網(wǎng)絡(luò)智能化管理提供了一套擴(kuò)展性良好...
王超 , 王芷陽 , 沈聰 - 《中國科學(xué)技術(shù)大學(xué)學(xué)報》 - 被引量: 0 - 2018年
來源: 愛學(xué)術(shù) / 萬方 / 知網(wǎng) / 維普網(wǎng) / 掌橋科研
基于樣本優(yōu)選與演示的深度強(qiáng)化學(xué)習(xí)
正向強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)更新的損失函數(shù).Gym與Atari實(shí)驗(yàn)平臺結(jié)果表明,與其他經(jīng)典的強(qiáng)化學(xué)習(xí)算法相比,由于采用了樣本優(yōu)選并且利用了演示樣本構(gòu)建新的回報函數(shù),所提算法在深度強(qiáng)化學(xué)習(xí)環(huán)境中進(jìn)一步加快了訓(xùn)練速度,提高了訓(xùn)練效率.該論文含有圖20幅,表4個,參考文...
向鎬鵬 - 《中國礦業(yè)大學(xué)》 - 被引量: 0 - 2020年
來源: 知網(wǎng) / 萬方
強(qiáng)化學(xué)習(xí)及其應(yīng)用研究
強(qiáng)化學(xué)習(xí)作為一種重要的機(jī)器學(xué)習(xí)方法,其最顯著的特點(diǎn)是通過與環(huán)境交互,利用環(huán)境反饋的獎懲,即增強(qiáng)信號來調(diào)整和改善自己的行為,最終獲得最佳策略.由于該方法具有對...
徐明亮 - 江南大學(xué) - 被引量: 10
來源: 愛學(xué)術(shù) / 萬方 / 知網(wǎng) / kns.cnki.net
以上都是強(qiáng)化學(xué)習(xí)方向可參考的文獻(xiàn),作者發(fā)表論文還需要注意文獻(xiàn)引用格式,或者更多強(qiáng)化學(xué)習(xí)文獻(xiàn)查詢,以及論文發(fā)表知識都可以咨詢在線學(xué)術(shù)顧問。