We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Dask - extending Python data tools for parallel and distributed computing

Formale Metadaten

Titel
Dask - extending Python data tools for parallel and distributed computing
Serientitel
Anzahl der Teile
611
Autor
Lizenz
CC-Namensnennung 2.0 Belgien:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache
Produktionsjahr2017

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
The growing Python data science ecosystem, including the foundational packagesNumpy and Pandas, provides powerful tools for data analysis that are widelyused in a variety of applications. Typically, these libraries were designedfor data that fits in memory and for computations that run on a single core. Dask is a Python library for parallel and distributed computing, using blockedalgorithms and task scheduling. By leveraging the existing Python dataecosystem, Dask enables to compute on arrays and dataframes that are largerthan memory, while exploiting parallelism or distributed computing power, butin a familiar interface (mirroring Numpy arrays and Pandas dataframes).