{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Dask Array\n", "\n", "\n", "Dask 数组协调许多 Numpy 数组,在网格内排列成块。它们支持 Numpy API 的很大一部分。\n", "\n", "Dask 数组使用阻塞算法提供了一个并行的、大于内存的 n 维数组。简单地说:分布式 Numpy\n", "\n", "- **并行**:使用计算机上的所有内核\n", "\n", "- **大于内存**:通过将数组分解成许多小块,按顺序操作这些块以最大限度地减少计算的内存占用,并有效地从磁盘流式传输数据,从而让您可以处理大于可用内存的数据集.\n", "\n", "- **阻塞算法**:通过执行许多较小的计算来执行大型计算" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "data": { "text/html": [ "