Reinforcement learning : (Record no. 155765)

MARC details
000 -LEADER
campo de control de longitud fija 02996nam a2200337 4500
003 - IDENTIFICADOR DE NÚMERO DE CONTROL
campo de control CL-VaUPLA
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
campo de control 20251209145804.0
007 - CAMPO FIJO DE DESCRIPCIÓN FÍSICA--INFORMACIÓN GENERAL
campo de control de longitud fija ta
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL
campo de control de longitud fija 250519b |||||||| |||| 00| 0 eng d
020 ## - NÚMERO INTERNACIONAL ESTÁNDAR DEL LIBRO
Número Internacional Estándar del Libro 978-0-262-03924-6
040 ## - FUENTE DE CATALOGACIÓN
Centro catalogador/agencia de origen CL-VaUPLA
Lengua de catalogación spa
Centro/agencia transcriptor CL-VaUPLA
Normas de descripción rda
082 04 - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY
Número de clasificación 006.3 S967r
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA
Nombre de persona Sutton, Richard S.,
9 (RLIN) 23761
Término indicativo de función/relación autor
245 10 - MENCIÓN DEL TÍTULO
Título Reinforcement learning :
Resto del título an introduction /
Mención de responsabilidad, etc. Richard S. Sutton and Andrew G. Barto
250 ## - MENCION DE EDICION
Mención de edición Second edition
264 #1 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT
Producción, publicación, distribución, fabricación y copyright Cambridge :
Nombre del de productor, editor, distribuidor, fabricante MIT Press,
Fecha de producción, publicación, distribución, fabricación o copyright 2020
300 ## - DESCRIPCIÓN FÍSICA
Extensión xviii, 322 páginas
336 ## - TIPO DE CONTENIDO
Fuente rdacontent
Término de tipo de contenido texto
Código de tipo de contenido txt
337 ## - TIPO DE MEDIO
Fuente rdamedia
Nombre/término del tipo de medio No mediado
Código del tipo de medio n
338 ## - TIPO DE SOPORTE
Fuente rdacarrier
Nombre/término del tipo de soporte Volumen
Código del tipo de soporte nc
490 0# - MENCIÓN DE SERIE
Mención de serie Adaptive computation and machine learning
505 0# - NOTA DE CONTENIDO CON FORMATO
Nota de contenido con formato I. Tabular solution methods - II. Approximate solution methods - III. Looking deeper
520 ## - RESUMEN, ETC.
Sumario, etc. La nueva edición, significativamente ampliada y actualizada, de un texto ampliamente utilizado sobre aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial. El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente intenta maximizar la cantidad total de recompensa que recibe al interactuar con un entorno complejo e incierto. En Aprendizaje por Refuerzo, Richard Sutton y Andrew Barto ofrecen una explicación clara y sencilla de las ideas y algoritmos clave del campo. Esta segunda edición se ha ampliado y actualizado significativamente, presentando nuevos temas y actualizando la cobertura de otros. Al igual que la primera edición, esta segunda edición se centra en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I abarca la mayor parte posible del aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluyendo UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de política y los métodos de gradiente de política. La Parte III incluye nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo actualizado de estudios de caso que incluye AlphaGo y AlphaGo Zero, la jugabilidad de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo
546 ## - NOTA DE IDIOMA
Nota de lengua/lenguaje Texto en inglés
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada INTELIGENCIA ARTIFICIAL
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada REFUERZO (PSICOLOGIA)
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada REDES NEURONALES (COMPUTADORES)
700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL
Nombre de persona Barto, Andrew G.,
9 (RLIN) 23762
Término indicativo de función/relación autor
942 ## - ELEMENTOS DE ENTRADA SECUNDARIOS (KOHA)
Fuente del sistema de clasificación o colocación Otra/Esquema de Clasificación Genérico
Tipo de ítem Koha Libros Impresos
Suprimir en OPAC No
998 ## - INFORMACIÓN DE CONTROL LOCAL (RLIN)
Nombre del catalogador, CIN (RLIN) AAR
Primera fecha, FD (RLIN) 19/05/25
Holdings
Estatus retirado Estado de pérdida Fuente del sistema de clasificación o colocación Estado de daño No para préstamo Colección Biblioteca de origen Biblioteca actual Ubicación en estantería Fecha de adquisición Total de préstamos Signatura topográfica completa Código de barras Visto por última vez Precio de reemplazo Tipo de ítem Koha
    Clasificación Decimal Dewey     Colección General Central Ciencias e ingeniería Circulación 19/05/2025   006.3 S967r 130652 20/05/2025 19/05/2025 Libros Impresos
Encargado de S.A.I | Teléfono: (32)2205911 |Anexo: 5911 | Correo: jonnathan.isla@upla.cl

Powered by Koha