The amount of data being generated today is staggering and growing. Apache Spark has emerged as the de facto tool to analyze big data and is now a critical part of the data science toolbox. Updated for Spark 3.0, this practical guide brings together Spark, statistical methods, and real-world datasets to teach you how to approach analytics problems using PySpark, Spark's Python API, and other best practices in Spark programming. Data scientists Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen,…
The amount of data being generated today is staggering and growing. Apache Spark has emerged as the de facto tool to analyze big data and is now a critical part of the data science toolbox. Updated for Spark 3.0, this practical guide brings together Spark, statistical methods, and real-world datasets to teach you how to approach analytics problems using PySpark, Spark's Python API, and other best practices in Spark programming.
Data scientists Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, and Josh Wills offer an introduction to the Spark ecosystem, then dive into patterns that apply common techniques-including classification, clustering, collaborative filtering, and anomaly detection, to fields such as genomics, security, and finance. This updated edition also covers NLP and image processing.
If you have a basic understanding of machine learning and statistics and you program in Python, this book will get you started with large-scale data analysis.
Familiarize yourself with Spark's programming model and ecosystem
Learn general approaches in data science
Examine complete implementations that analyze large public datasets
Discover which machine learning tools make sense for particular problems
The amount of data being generated today is staggering and growing. Apache Spark has emerged as the de facto tool to analyze big data and is now a critical part of the data science toolbox. Updated for Spark 3.0, this practical guide brings together Spark, statistical methods, and real-world datasets to teach you how to approach analytics problems using PySpark, Spark's Python API, and other best practices in Spark programming.
Data scientists Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, and Josh Wills offer an introduction to the Spark ecosystem, then dive into patterns that apply common techniques-including classification, clustering, collaborative filtering, and anomaly detection, to fields such as genomics, security, and finance. This updated edition also covers NLP and image processing.
If you have a basic understanding of machine learning and statistics and you program in Python, this book will get you started with large-scale data analysis.
Familiarize yourself with Spark's programming model and ecosystem
Learn general approaches in data science
Examine complete implementations that analyze large public datasets
Discover which machine learning tools make sense for particular problems
Explore code that can be adapted to many uses
Atsiliepimai
Atsiliepimų nėra
0 pirkėjai įvertino šią prekę.
5
0%
4
0%
3
0%
2
0%
1
0%
Kainos garantija
Ženkliuku „Kainos garantija” pažymėtoms prekėms Knygos.lt garantuoja geriausią kainą. Jei identiška prekė kitoje internetinėje parduotuvėje kainuoja mažiau - kompensuojame kainų skirtumą. Kainos lyginamos su knygos.lt nurodytų parduotuvių sąrašu prekių kainomis. Knygos.lt įsipareigoja kompensuoti kainų skirtumą pirkėjui, kuris kreipėsi „Kainos garantijos” taisyklėse nurodytomis sąlygomis. Sužinoti daugiau
Elektroninė knyga
22,39 €
DĖMESIO!
Ši knyga pateikiama ACSM formatu. Jis nėra tinkamas įprastoms skaityklėms, kurios palaiko EPUB ar MOBI formato el. knygas.
Svarbu! Nėra galimybės siųstis el. knygų jungiantis iš Jungtinės Karalystės.
Tai knyga, kurią parduoda privatus žmogus. Kai apmokėsite užsakymą, jį per 7 d. išsiųs knygos pardavėjas . Jei to pardavėjas nepadarys laiku, pinigai jums bus grąžinti automatiškai.
Šios knygos būklė nėra įvertinta knygos.lt ekspertų, todėl visa atsakomybė už nurodytą knygos kokybę priklauso pardavėjui.
Perskaityta knyga:
Nenauja knyga, kuri parduodama tiesiai iš knygos.lt sandėlio. Knygos kokybė įvertinta knygos.lt ekspertų.
Tai knyga, kurią parduoda privatus žmogus. Kai apmokėsite užsakymą, jį per 7 d. išsiųs knygos pardavėjas . Jei to pardavėjas nepadarys laiku, pinigai jums bus grąžinti automatiškai.
Šios knygos būklė nėra įvertinta knygos.lt ekspertų, todėl visa atsakomybė už nurodytą knygos kokybę priklauso pardavėjui.
Atsiliepimai