Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Дж., 2017.
В этой практичной книге четверо специалистов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях, и на этих примерах демонстрируют решения распространенных аналитических проблем.