Алгоритмы обучения с подкреплением на Python, Лонца А., 2020.
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
Глубокое обучение.
Теперь можно задаться вопросом: почему глубокое обучение в сочетании с ОП дает такие замечательные результаты? Главным образом потому, что глубокое обучение способно справляться с пространством состояний очень высокой размерности. До изобретения глубокого ОП пространства состояний приходилось разбивать на более простые представления, называемые признаками. Их было трудно проектировать, и иногда эта задача была подвластна только узким специалистам. Теперь же, пользуясь глубокими нейронными сетями, в частности сверточными нейронными сетями (СНС) или рекуррентными нейронными сетями (РНС), ОП-система может обучиться различным уров- ням абстракции непосредственно на исходных пикселях или последовательных данных (например, текстах на естественном языке). Такая конфигурация показана на рис. 1.3.
Содержание.
Об авторе.
Предисловие.
Часть I.АЛГОРИТМЫ И ОКРУЖАЮЩИЕ СРЕДЫ.
Часть II.БЕЗМОДЕЛЬНЫЕ АЛГОРИТМЫ ОП.
Часть III.ЗА ПРЕДЕЛАМИ БЕЗМОДЕЛЬНЫХ АЛГОРИТМОВ.
Купить .
По кнопкам выше и ниже «Купить бумажную книгу» и по ссылке «Купить» можно купить эту книгу с доставкой по всей России и похожие книги по самой лучшей цене в бумажном виде на сайтах официальных интернет магазинов Лабиринт, Озон, Буквоед, Читай-город, Литрес, My-shop, Book24, Books.ru.
По кнопке «Купить и скачать электронную книгу» можно купить эту книгу в электронном виде в официальном интернет магазине «Литрес», если она у них есть в наличии, и потом ее скачать на их сайте.
По кнопке «Найти похожие материалы на других сайтах» можно найти похожие материалы на других сайтах.
On the buttons above and below you can buy the book in official online stores Labirint, Ozon and others. Also you can search related and similar materials on other sites.
Теги: Лонца :: книги по программированию :: программирование :: Python
Смотрите также учебники, книги и учебные материалы:
- Вы пока еще не знаете JS, Познакомьтесь, JavaScript, Симпсон К., 2022
- Веб-разработка с применением Node и Express, Полноценное использование стека JavaScript, Браун И., 2021
- Паттерны проектирования для C# и платформы .NET Core., Арораа Г., Чилберто Д., 2021
- Data Science в действии, Апельцин Л., 2023
- React, Быстрый старт, Стефанов С., 2023
- React, Современные шаблоны для разработки приложений, Бэнкс А., Порселло Е., 2022
- Kafka Streams и ksqlDB, Данные в реальном времени, Сеймур М., 2023
- JavaScript, Рецепты для разработчиков, Скотт А., Макдоналд М., Пауэрс Ш., 2023