Грокаем глубокое обучение с подкреплением, Моралес М., 2023.
Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах. Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Оценка поведения агента.
Вы уже знаете, как сложно сбалансировать краткосрочные и долгосрочные цели. Все мы сталкиваемся с этой проблемой по нескольку раз на дню. Например, чем лучше заняться этим вечером: посмотреть фильм или продолжить чтение книги? Первый вариант сразу же приносит удовлетворение: на протяжении полутора-двух часов вы можете променять нищету на богатство, одиночество на любовь, избыточный вес на стройную фигуру — и все это не переставая жевать попкорн. А вот чтение книги не даст вам особых ощущений сегодня вечером, но в дальнейшем эти ощущения могут (без какой-либо гарантии) оказаться куда сильнее.
Краткое содержание.
Предисловие.
Вступление.
Благодарности.
О книге.
От издательства.
Об авторе.
Глава 1.Введение в глубокое обучение с подкреплением.
Глава 2.Математические основы обучения с подкреплением.
Глава 3.Баланс краткосрочных и долгосрочных целей.
Глава 4.Баланс между сбором и использованием информации.
Глава 5.Оценка поведения агента.
Глава 6.Улучшение поведения агентов.
Глава 7.Более действенные и эффективные способы достижения целей.
Глава 8.Введение в ценностно ориентированное глубокое обучение с подкреплением.
Глава 9.Более стабильные ценностно ориентированные методы.
Глава 10.Ценностно ориентированные методы с эффективным использованием выборок.
Глава 11.Методы градиента политик и «актер-критик».
Глава 12.Продвинутые методы «актер-критик».
Глава 13.Путь к сильному искусственному интеллекту.
Купить .
По кнопкам выше и ниже «Купить бумажную книгу» и по ссылке «Купить» можно купить эту книгу с доставкой по всей России и похожие книги по самой лучшей цене в бумажном виде на сайтах официальных интернет магазинов Лабиринт, Озон, Буквоед, Читай-город, Литрес, My-shop, Book24, Books.ru.
По кнопке «Купить и скачать электронную книгу» можно купить эту книгу в электронном виде в официальном интернет магазине «ЛитРес», и потом ее скачать на сайте Литреса.
По кнопке «Найти похожие материалы на других сайтах» можно найти похожие материалы на других сайтах.
On the buttons above and below you can buy the book in official online stores Labirint, Ozon and others. Also you can search related and similar materials on other sites.
Теги: Моралес :: книги по программированию :: программирование :: искусственный интеллект :: Python
Смотрите также учебники, книги и учебные материалы:
- Делай как в Google, Разработка программного обеспечения, Винтерс Т., Маншрек Т., Райт Х., 202
- Python и наука о данных для чайников, Мюллер Д.П., Массарон Л., 2020
- Грокаем машинное обучение, Серрано Л., 2024
- Грокаем глубокое обучение, Траск Э., 2020
- Грокаем алгоритмы искусственного интеллекта, Харбанс Р., 2023
- Программирование для Android на Kotlin, Гриффитс Д.
- Глубокое обучение, Легкая разработка проектов на Python, Вейдман С., 2021
- Глубокое обучение с подкреплением, Теория и практика на языке Python, Грессер Л., Кенг В., 2022