Amazon cover image
Image from Amazon.com

Reinforcement learning : an introduction / Richard S. Sutton and Andrew G. Barto

By: Contributor(s): Material type: TextTextSeries: Adaptive computation and machine learningPublisher: Cambridge : MIT Press, 2020Edition: Second editionDescription: xviii, 322 páginasContent type:
  • texto
Media type:
  • No mediado
Carrier type:
  • Volumen
ISBN:
  • 978-0-262-03924-6
Subject(s): DDC classification:
  • 006.3 S967r
Contents:
I. Tabular solution methods - II. Approximate solution methods - III. Looking deeper
Summary: La nueva edición, significativamente ampliada y actualizada, de un texto ampliamente utilizado sobre aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial. El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente intenta maximizar la cantidad total de recompensa que recibe al interactuar con un entorno complejo e incierto. En Aprendizaje por Refuerzo, Richard Sutton y Andrew Barto ofrecen una explicación clara y sencilla de las ideas y algoritmos clave del campo. Esta segunda edición se ha ampliado y actualizado significativamente, presentando nuevos temas y actualizando la cobertura de otros. Al igual que la primera edición, esta segunda edición se centra en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I abarca la mayor parte posible del aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluyendo UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de política y los métodos de gradiente de política. La Parte III incluye nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo actualizado de estudios de caso que incluye AlphaGo y AlphaGo Zero, la jugabilidad de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Collection Call number Status Date due Barcode
Libros Impresos Libros Impresos Ciencias e ingeniería Circulación Colección General 006.3 S967r (Browse shelf(Opens below)) Available 130652

I. Tabular solution methods - II. Approximate solution methods - III. Looking deeper

La nueva edición, significativamente ampliada y actualizada, de un texto ampliamente utilizado sobre aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial. El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente intenta maximizar la cantidad total de recompensa que recibe al interactuar con un entorno complejo e incierto. En Aprendizaje por Refuerzo, Richard Sutton y Andrew Barto ofrecen una explicación clara y sencilla de las ideas y algoritmos clave del campo. Esta segunda edición se ha ampliado y actualizado significativamente, presentando nuevos temas y actualizando la cobertura de otros. Al igual que la primera edición, esta segunda edición se centra en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I abarca la mayor parte posible del aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluyendo UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de política y los métodos de gradiente de política. La Parte III incluye nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo actualizado de estudios de caso que incluye AlphaGo y AlphaGo Zero, la jugabilidad de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo

Texto en inglés

Encargado de S.A.I | Teléfono: (32)2205911 |Anexo: 5911 | Correo: jonnathan.isla@upla.cl

Powered by Koha