Spodbujevano učenje: Razlika med redakcijama

Izbrisana vsebina Dodana vsebina
Smihael (pogovor | prispevki)
Smihael (pogovor | prispevki)
Oznaka: Izboljšani urejevalnik wikikode
Vrstica 21:
| policy (strategija) || odločitev, katero dejanje naj bo izvedeno v določenem stanju || dražljaj-reakcija, asociacije
|-
| reward function (nagrada) || akraktivnostučinkovitost prehoda med stanjema || prijetnost/odvratnost posledice dolocenegadoločenega dajanja
|-
| value function (ocena dejanja) || pričakovana vsota vseh nagrad z upoštevanjem še prihajajočih stanj || daljnoročno gledanopričakovano zadovoljstvo z rezultatom
|}