Julekalender luke 3: AI for kontinuerlig læring

Kunstig intelligens med Morten Goodwin - En podkast av Universitetet i Agder

Prøv Podimo gratis i hele 60! dager!

I Podimo finner du eksklusive podkaster og bestselgende lydbøker tilpasset dine ører

Kategorier:

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på. Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html