Súbojovanie hlbokého Q vzdelávania s Tensorflow 2 a Keras

Blog

Súbojovanie s Deep Q Learning je s Tensorflow 2 a Keras jednoduchšie než kedykoľvek predtým. V tomto tutoriáli pre začiatočníkov s hĺbkovým posilňovaním od základov nakódujeme súboj hlbokej siete q a agenta bez toho, aby sme museli mať predchádzajúce skúsenosti. Vyškolíme agenta, aby pristál s vesmírnou loďou na povrchu mesiaca, pomocou prostredia lunárneho pristávacieho zariadenia z telocvične OpenAI.



Súbojovú sieť je možné použiť na pravidelné aj dvojité učenie q, pretože je to len nová sieťová architektúra. Nevyžaduje žiadnu zmenu v algoritmoch q učenia alebo dvojitého učenia q. Jednoducho musíme zmeniť náš informačný kanál, aby vyhovoval novým tokom hodnôt a výhod a skombinovať ich spôsobom, ktorý dáva zmysel.

https://youtu.be/CoePrz751lg



#deep-learning #python #machine-learning #tensorflow #umelá inteligencia

YouTube

Súbojovanie hlbokého Q vzdelávania s Tensorflow 2 a Keras

Súbojovanie s Deep Q Learning je s Tensorflow 2 a Keras jednoduchšie než kedykoľvek predtým. V tomto tutoriáli pre začiatočníkov s hlbokým posilňovaním zakódujeme duel ...