Основы Data Science и Big Data, Python и наука о данных, Силен Д., Мейсман А., Али М., 2017

Основы Data Science и Big Data, Python и наука о данных, Силен Д., Мейсман А., Али М., 2017.

   Data Science — это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.
Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.
Обработка и анализ данных — одна из самых горячих областей ГГ, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книг а станет отправной точкой для вашего путешествия в увлекательный мир Data Science.

Основы Data Science и Big Data, Python и наука о данных, Силен Д., Мейсман А., Али М., 2017


Data science в мире больших данных.
Нод обобщающим термином «большие данные» принято понимать любые наборы данных, достаточно большие и сложные для того, чтобы их можно было обработать традиционными средствами работы с данными (например, РСУБД — реляционными системами управления базами данных). Широко распространенные РСУБД давно считаются универсальным инструментом, но спрос на обработку больших данных показывает иное. В концепцию data science входит использование методов анализа огромных объемов данных и извлечения содержащейся в них информации. Связь между большими данными и data science такая же, как между сырой нефтью и нефтеперерабатывающим заводом. Data science и большие данные развивались на базе статистики и традиционного управления данными, но сейчас считаются разными дисциплинами.

Data science — это расширение статистики, способное справляться с огромными объемами данных, производимыми в наши дни. Data science добавляет методы из computer science в репертуар статистики. В аналитической заметке Лейни и Карта «Emerging Role of the Data Scientist and the Art of Data Science» были проработаны сотни описаний рабочих обязанностей специалистов data science, статистиков и аналитиков бизнес-данных, чтобы выявить различия между этими должностями. Главное, что отличает специалиста data science от статистика, — это умение работать с большими данными и подготовка в области машинного обучения, организации вычислений и построения алгоритмов. Их инструментарии обычно тоже различаются; в описаниях работы специалистов data science чаще упоминается умение использовать Hadoop, Pig, Spark, R, Python и Java (среди прочего). He огорчайтесь, если вас устрашило это перечисление; многие пункты будут постепенно раскрыты в этой книге, хотя основное внимание будет уделено Python. Python — замечательный язык для data science, потому что для него написано много библиотек data science и он широко поддерживается специализированными программами. Например, почти в каждой популярной базе данных NoSL существует программный интерфейс (API) для Python. Из-за этих особенностей, а также из-за возможности быстро строить прототипы на языке Python с сохранением приемлемой производительности его популярность в мире data science быстро растет.

СОДЕРЖАНИЕ.
Предисловие.
Благодарности.
О книге.
Структура книги.
Для кого написана эта книга.
Условные обозначения и загружаемые файлы.
Об авторах.
От издательства.
Глава 1. Data science в мире больших данных.
Глава 2. Процесс data science.
Глава 3. Машинное обучение.
Глава 4. Работа с большими данными на одном компьютере.
Глава 5. Первые шаги в области больших данных.
Глава б. Присоединяйтесь к движению NoSQL.
Глава 7. Графовые базы данных.
Глава 8. Глубокий анализ текста.
Глава 9. Визуализация данных для конечного пользователя.
Приложение А. Настройка Elasticsearch.
А.1. Установка в Linux.
A.2. Установка в Windows.
Приложение Б. Установка Neo4j.
Б.1. Установка в Linux.
Б.2. Установка в Windows.
Приложение В. Установка сервера MySQL.
B.1. Установка в Windows.
В.2. Установка в Linux.
Приложение Г. Установка Anaconda в виртуальной среде.
Г.1. Установка в Linux.
Г.2. Установка в Windows.
Г.3. Настройка среды.



Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Основы Data Science и Big Data, Python и наука о данных, Силен Д., Мейсман А., Али М., 2017 - fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу



Скачать - pdf - Яндекс.Диск.
Дата публикации:





Теги: :: :: :: ::


Следующие учебники и книги:
Предыдущие статьи:


 


 

Книги, учебники, обучение по разделам




Не нашёл? Найди:





2021-09-15 23:13:52