Elliot
Администратор
- Регистрация
- 3 Дек 2014
- Сообщения
- 125.371
- Реакции
- 189.596
Складчина: [ДМК] Apache Arrow. Обработка больших данных [Мэтью Топол]
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его преимуществах и универсальности.
Эта книга познакомит вас с форматами обмена и хранения данных и расскажет о взаимосвязи Arrow с Parquet, Protocol Buffers, FlatBuffers, JSON и CSV. Вы откроете для себя подпроекты Apache Arrow, включая Flight, SQL, Database Connectivity и nanoarrow, и освоите интеграцию с популярными системами обработки аналитических данных Snowflake, Dremio и DuckDB. В заключительных главах приводятся реальные примеры и описания продуктов на базе Apache Arrow.
Вы научитесь:
использовать библиотеки Apache Arrow;
обеспечивать эффективное производство и потребление данных Apache Arrow;
применять вычислительный механизм Arrow Асего для выполнения сложных операций;
создавать серверы и клиенты Arrow Flight для быстрой передачи данных;
создавать библиотеки Arrow в локальном режиме и распространять их в сообществе.
Желательны базовые знания концепций анализа данных. В книге представлены многочисленные примеры исходного кода на языках C++, Python и Go.
Издание предназначено разработчикам, инженерам и научным работникам, занятым в обработке данных и желающим в полной мере изучить и использовать функциональные возможности Apache Arrow. Независимо от того, создаете ли вы утилиты для анализа данных и механизмов запросов или формируете полнофункциональные конвейеры для обработки табличных данных, эта книга поможет вам организовать работу на любом языке программирования. Программисты и исследователи найдут в ней рекомендации по выбору оптимальной среды для достижения целевых задач приложения, а также по управлению большими данными и их анализу.
Издание: Цветное
Оригинальное название: In-Memory Analytics with Apache Arrow
Оригинальный правообладатель: Packt
Автор: Топол М.
Объем, стр: 410
ISBN: 978-5-93700-273-0
Формат: PDF
Стоимость: 1520
СКАЧАТЬ
Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его преимуществах и универсальности.
Эта книга познакомит вас с форматами обмена и хранения данных и расскажет о взаимосвязи Arrow с Parquet, Protocol Buffers, FlatBuffers, JSON и CSV. Вы откроете для себя подпроекты Apache Arrow, включая Flight, SQL, Database Connectivity и nanoarrow, и освоите интеграцию с популярными системами обработки аналитических данных Snowflake, Dremio и DuckDB. В заключительных главах приводятся реальные примеры и описания продуктов на базе Apache Arrow.
Вы научитесь:
использовать библиотеки Apache Arrow;
обеспечивать эффективное производство и потребление данных Apache Arrow;
применять вычислительный механизм Arrow Асего для выполнения сложных операций;
создавать серверы и клиенты Arrow Flight для быстрой передачи данных;
создавать библиотеки Arrow в локальном режиме и распространять их в сообществе.
Желательны базовые знания концепций анализа данных. В книге представлены многочисленные примеры исходного кода на языках C++, Python и Go.
Издание предназначено разработчикам, инженерам и научным работникам, занятым в обработке данных и желающим в полной мере изучить и использовать функциональные возможности Apache Arrow. Независимо от того, создаете ли вы утилиты для анализа данных и механизмов запросов или формируете полнофункциональные конвейеры для обработки табличных данных, эта книга поможет вам организовать работу на любом языке программирования. Программисты и исследователи найдут в ней рекомендации по выбору оптимальной среды для достижения целевых задач приложения, а также по управлению большими данными и их анализу.
Издание: Цветное
Оригинальное название: In-Memory Analytics with Apache Arrow
Оригинальный правообладатель: Packt
Автор: Топол М.
Объем, стр: 410
ISBN: 978-5-93700-273-0
Формат: PDF
Стоимость: 1520
СКАЧАТЬ
Что бы скачивать сливы курсов и складчины вы должны зарегистрироваться
Возможно, Вас ещё заинтересует:
- Кейк бокс Малина Рафаэлло [Мария Манахова]
- Кекс Бокс Вишня Шоколад [Мария Манахова]
- Всё для учителя в одном месте: курсы, олимпиады, тесты и материалы для уроков [№1 на 1 месяц] [infourok.ru]
- Приватный клуб SEO-профи: [№1 на 1 месяц] [trafficthinktank.com]
- Показывает продажи, конкуренцию и идеи товаров на Etsy [№1 на 1 месяц] [everbee.io]
- Составляйте строительные сметы за 5 минут с ИИ [№1 на 1 месяц] [freesmetaonline.ru]