Kód: 50604579
APRENDE APACHE SPARK Construya Pipelines Escalables con PySpark y OptimizaciónEste libro está dirigido a estudiantes, desarrolladores, ingenieros de datos, científicos de datos y profesionales de tecnología que buscan dominar Apac ... celý popis
Španělština
Nákupem získáte 36 bodů
Anotace knihy
APRENDE APACHE SPARK Construya Pipelines Escalables con PySpark y Optimización
Este libro está dirigido a estudiantes, desarrolladores, ingenieros de datos, científicos de datos y profesionales de tecnología que buscan dominar Apache Spark en la práctica, tanto en entornos corporativos como en la nube pública y en integraciones modernas. Aprenderá a construir pipelines escalables para el procesamiento de datos a gran escala, orquestando cargas de trabajo distribuidas con AWS EMR, Databricks, Azure Synapse y Google Cloud Dataproc.
El contenido abarca integración con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB y Python, además de técnicas avanzadas de tuning, optimización de jobs, análisis en tiempo real, machine learning con MLlib y automatización de workflows.
Incluye:
• Implementación de pipelines ETL y ELT con Spark SQL y DataFrames
• Procesamiento de datos en streaming e integración con Kafka y AWS Kinesis
• Optimización de jobs distribuidos, tuning de performance y uso de Spark UI
• Integración de Spark con S3, Data Lake, NoSQL y bases de datos relacionales
• Deploy en clusters gestionados en AWS, Azure y Google Cloud
• Machine Learning aplicado con MLlib, Delta Lake y Databricks
• Automatización de rutinas, monitoreo y escalabilidad para Big Data
Al final, dominará Apache Spark como solución profesional para análisis de datos, automatización de procesos y machine learning en entornos complejos y de alto rendimiento.
Parametry knihy
364 Kč
Španělština
Osobní odběr Praha, Brno a 47512 dalších
Copyright ©2008-26 nejlevnejsi-knihy.cz Všechna práva vyhrazenaSoukromíCookies
Vrácení do měsíce
571 999 099 (8-15.30h)Nákupní košík ( prázdný )
Nacházíte se: