Apache Airflow и конвейеры обработки данных

Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров....

Full description

Bibliographic Details
Main Author: Харенслак Б.
Other Authors: де Р. Д.
Format: Book
Language:Russian
Published: Москва ДМК Пресс 2022
Online Access:https://e.lanbook.com/book/241133
https://e.lanbook.com/img/cover/book/241133.jpg
Description
Summary:Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров. Простота пользовательского интерфейса, возможности plug-and-play и гибкие сценарии Python оптимизируют решение любых задач, касающихся управления данными. Эта книга научит вас создавать и сопровождать эффективные конвейеры обработки данных. Вы изучите наиболее распространен-ные модели их использования, особенности ориентированных ациклических графов (ОАГ), которые обеспечивают работу Airflow, а также способы их настройки в соответствии с потребностями вашего конвейера. Издание предназначено для специалистов по DevOps, обработке и хранению данных, машинному обучению, а также системных администраторов с навыками программирования на Python.
Physical Description:502 с.
Audience:Книга из коллекции ДМК Пресс - Информатика
Bibliography:Библиогр.: доступна в карточке книги, на сайте ЭБС Лань
ISBN:978-5-97060-970-5