MARC details
| 000 -LEADER |
| campo de control de longitud fija |
02996nam a2200337 4500 |
| 003 - IDENTIFICADOR DE NÚMERO DE CONTROL |
| campo de control |
CL-VaUPLA |
| 005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN |
| campo de control |
20251209145804.0 |
| 007 - CAMPO FIJO DE DESCRIPCIÓN FÍSICA--INFORMACIÓN GENERAL |
| campo de control de longitud fija |
ta |
| 008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL |
| campo de control de longitud fija |
250519b |||||||| |||| 00| 0 eng d |
| 020 ## - NÚMERO INTERNACIONAL ESTÁNDAR DEL LIBRO |
| Número Internacional Estándar del Libro |
978-0-262-03924-6 |
| 040 ## - FUENTE DE CATALOGACIÓN |
| Centro catalogador/agencia de origen |
CL-VaUPLA |
| Lengua de catalogación |
spa |
| Centro/agencia transcriptor |
CL-VaUPLA |
| Normas de descripción |
rda |
| 082 04 - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY |
| Número de clasificación |
006.3 S967r |
| 100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA |
| Nombre de persona |
Sutton, Richard S., |
| 9 (RLIN) |
23761 |
| Término indicativo de función/relación |
autor |
| 245 10 - MENCIÓN DEL TÍTULO |
| Título |
Reinforcement learning : |
| Resto del título |
an introduction / |
| Mención de responsabilidad, etc. |
Richard S. Sutton and Andrew G. Barto |
| 250 ## - MENCION DE EDICION |
| Mención de edición |
Second edition |
| 264 #1 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT |
| Producción, publicación, distribución, fabricación y copyright |
Cambridge : |
| Nombre del de productor, editor, distribuidor, fabricante |
MIT Press, |
| Fecha de producción, publicación, distribución, fabricación o copyright |
2020 |
| 300 ## - DESCRIPCIÓN FÍSICA |
| Extensión |
xviii, 322 páginas |
| 336 ## - TIPO DE CONTENIDO |
| Fuente |
rdacontent |
| Término de tipo de contenido |
texto |
| Código de tipo de contenido |
txt |
| 337 ## - TIPO DE MEDIO |
| Fuente |
rdamedia |
| Nombre/término del tipo de medio |
No mediado |
| Código del tipo de medio |
n |
| 338 ## - TIPO DE SOPORTE |
| Fuente |
rdacarrier |
| Nombre/término del tipo de soporte |
Volumen |
| Código del tipo de soporte |
nc |
| 490 0# - MENCIÓN DE SERIE |
| Mención de serie |
Adaptive computation and machine learning |
| 505 0# - NOTA DE CONTENIDO CON FORMATO |
| Nota de contenido con formato |
I. Tabular solution methods - II. Approximate solution methods - III. Looking deeper |
| 520 ## - RESUMEN, ETC. |
| Sumario, etc. |
La nueva edición, significativamente ampliada y actualizada, de un texto ampliamente utilizado sobre aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial. El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente intenta maximizar la cantidad total de recompensa que recibe al interactuar con un entorno complejo e incierto. En Aprendizaje por Refuerzo, Richard Sutton y Andrew Barto ofrecen una explicación clara y sencilla de las ideas y algoritmos clave del campo. Esta segunda edición se ha ampliado y actualizado significativamente, presentando nuevos temas y actualizando la cobertura de otros. Al igual que la primera edición, esta segunda edición se centra en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I abarca la mayor parte posible del aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluyendo UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de política y los métodos de gradiente de política. La Parte III incluye nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo actualizado de estudios de caso que incluye AlphaGo y AlphaGo Zero, la jugabilidad de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo |
| 546 ## - NOTA DE IDIOMA |
| Nota de lengua/lenguaje |
Texto en inglés |
| 650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
| Término de materia o nombre geográfico como elemento de entrada |
INTELIGENCIA ARTIFICIAL |
| 650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
| Término de materia o nombre geográfico como elemento de entrada |
REFUERZO (PSICOLOGIA) |
| 650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
| Término de materia o nombre geográfico como elemento de entrada |
REDES NEURONALES (COMPUTADORES) |
| 700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL |
| Nombre de persona |
Barto, Andrew G., |
| 9 (RLIN) |
23762 |
| Término indicativo de función/relación |
autor |
| 942 ## - ELEMENTOS DE ENTRADA SECUNDARIOS (KOHA) |
| Fuente del sistema de clasificación o colocación |
Otra/Esquema de Clasificación Genérico |
| Tipo de ítem Koha |
Libros Impresos |
| Suprimir en OPAC |
No |
| 998 ## - INFORMACIÓN DE CONTROL LOCAL (RLIN) |
| Nombre del catalogador, CIN (RLIN) |
AAR |
| Primera fecha, FD (RLIN) |
19/05/25 |