Combined Use of Reinforcement Learning and Simulated Annealing / Nejlevnější knihy
Combined Use of Reinforcement Learning and Simulated Annealing

Kód: 06821373

Combined Use of Reinforcement Learning and Simulated Annealing

Autor Peter Stefan

In the dissertation combined reinforcement learning§(RL) and §simulated annealing (SA) concepts, problems, proposed§solutions, §algorithms and application examples are shown.§RL models a decision maker as a goal-driven agent§aimin ... celý popis

1490


U nakladatele na objednávku
Odesíláme za 3-5 dnů
Přidat mezi přání

Mohlo by se vám také líbit

Darujte tuto knihu ještě dnes
  1. Objednejte knihu a zvolte Zaslat jako dárek.
  2. Obratem obdržíte darovací poukaz na knihu, který můžete ihned předat obdarovanému.
  3. Knihu zašleme na adresu obdarovaného, o nic se nestaráte.

Více informací

Více informací o knize Combined Use of Reinforcement Learning and Simulated Annealing

Nákupem získáte 149 bodů

Anotace knihy

In the dissertation combined reinforcement learning§(RL) and §simulated annealing (SA) concepts, problems, proposed§solutions, §algorithms and application examples are shown.§RL models a decision maker as a goal-driven agent§aiming to reach §goal states in the problem representation state§space. The agent §takes different choices among the numerous§possibilities, but each §choice can make different impact in the environment.§Each decision §has some effect being expressed in the form of§numeric honor or §dishonor, in a reward value. The agent utilizes the§feedback to §recognize which actions are honored and which are§not. The agent §then tries to govern its decision sequence into the§direction that §maximizes the environment s satisfaction .§The concept of SA is based on the analogy of how§liquids freeze. §There an initially high temperature and disordered§melt is slowly §cooled down and reaches thermal equilibrium.§While in annealing the temperature parameter bounds are §straightforward, in SA they might be dependent on the§problem and §its numeric representation.§This dissertation gives a method which can be used§for defining §temperature bounds in RL environment.

Parametry knihy

1490

Oblíbené z jiného soudku



Osobní odběr Praha, Brno a 12903 dalších

Copyright ©2008-24 nejlevnejsi-knihy.cz Všechna práva vyhrazenaSoukromíCookies


Můj účet: Přihlásit se
Všechny knihy světa na jednom místě. Navíc za skvělé ceny.

Nákupní košík ( prázdný )

Vyzvednutí v Zásilkovně
zdarma nad 1 499 Kč.

Nacházíte se: