注意
转到末尾下载完整的示例代码。
在 Matplotlib 中选择颜色映射#
Matplotlib 有许多内置的颜色映射,可以通过 matplotlib.colormaps
访问。还有外部库具有许多额外的颜色映射,可以在 Matplotlib 文档的 第三方颜色映射 部分查看。这里我们简要讨论如何在许多选项之间进行选择。有关创建您自己的颜色映射的帮助,请参阅 在 Matplotlib 中创建颜色映射。
要获取所有已注册颜色映射的列表,您可以执行
from matplotlib import colormaps
list(colormaps)
概述#
选择好的颜色映射背后的理念是为您的数据集在 3D 颜色空间中找到一个良好的表示。任何给定数据集的最佳颜色映射取决于许多因素,包括:
是表示形状还是度量数据([Ware])
您对数据集的了解(例如,是否存在一个临界值,其他值从中偏离?)
要绘制的参数是否具有直观的颜色方案
该领域是否存在受众可能期望的标准
对于许多应用,感知均匀的颜色映射是最佳选择;即,在数据中相等的步骤被感知为颜色空间中相等的步骤的颜色映射。研究人员发现,人脑感知到的亮度参数变化比色调变化更好地感知数据变化。因此,亮度在整个颜色映射中单调增加的颜色映射将更容易被观看者理解。感知均匀的颜色映射的精彩示例也可以在 第三方颜色映射 部分找到。
颜色可以用各种方式在 3D 空间中表示。一种表示颜色的方法是使用 CIELAB。在 CIELAB 中,颜色空间由亮度 \(L^*\);红-绿 \(a^*\);和黄-蓝 \(b^*\) 表示。然后可以使用亮度参数 \(L^*\) 来了解更多关于 Matplotlib 颜色映射如何被观看者感知的信息。
一个学习人类对颜色映射感知的优秀入门资源来自 [IBM]。
颜色映射的类别#
颜色映射通常根据其功能分为几个类别(参见,例如,[Moreland])
顺序:亮度变化,通常颜色饱和度递增,通常使用单一色调;应该用于表示具有顺序的信息。
发散:亮度变化,可能还有两种不同颜色的饱和度变化,这两种颜色在中间以不饱和颜色相遇;当要绘制的信息具有临界中间值时(例如地形或数据在零附近偏离时)应使用此方法。
循环:两种不同颜色的亮度变化,在中间相遇,并且在不饱和颜色处的起始/结束处相遇;应该用于在端点处回绕的值,例如相位角、风向或一天中的时间。
定性:通常是杂色;应该用于表示没有顺序或关系的信息。
from colorspacious import cspace_converter
import matplotlib.pyplot as plt
import numpy as np
import matplotlib as mpl
首先,我们将显示每个颜色映射的范围。请注意,有些颜色映射的变化似乎比其他颜色映射“快”。
cmaps = {}
gradient = np.linspace(0, 1, 256)
gradient = np.vstack((gradient, gradient))
def plot_color_gradients(category, cmap_list):
# Create figure and adjust figure height to number of colormaps
nrows = len(cmap_list)
figh = 0.35 + 0.15 + (nrows + (nrows - 1) * 0.1) * 0.22
fig, axs = plt.subplots(nrows=nrows + 1, figsize=(6.4, figh))
fig.subplots_adjust(top=1 - 0.35 / figh, bottom=0.15 / figh,
left=0.2, right=0.99)
axs[0].set_title(f'{category} colormaps', fontsize=14)
for ax, name in zip(axs, cmap_list):
ax.imshow(gradient, aspect='auto', cmap=mpl.colormaps[name])
ax.text(-0.01, 0.5, name, va='center', ha='right', fontsize=10,
transform=ax.transAxes)
# Turn off *all* ticks & spines, not just the ones with colormaps.
for ax in axs:
ax.set_axis_off()
# Save colormap list for later.
cmaps[category] = cmap_list
顺序#
对于顺序图,亮度值在整个颜色映射中单调增加。这很好。颜色映射中的某些 \(L^*\) 值范围从 0 到 100(二进制和其他灰度),而另一些则从 \(L^*=20\) 左右开始。那些 \(L^*\) 范围较小的颜色映射将相应地具有较小的感知范围。还要注意,\(L^*\) 函数在颜色映射之间有所不同:有些在 \(L^*\) 中近似线性,而另一些则更弯曲。
plot_color_gradients('Perceptually Uniform Sequential',
['viridis', 'plasma', 'inferno', 'magma', 'cividis'])
plot_color_gradients('Sequential',
['Greys', 'Purples', 'Blues', 'Greens', 'Oranges', 'Reds',
'YlOrBr', 'YlOrRd', 'OrRd', 'PuRd', 'RdPu', 'BuPu',
'GnBu', 'PuBu', 'YlGnBu', 'PuBuGn', 'BuGn', 'YlGn'])
顺序2#
来自顺序2图的许多 \(L^*\) 值是单调增加的,但有些(秋季、冷色、春季和冬季)在 \(L^*\) 空间中趋于平稳甚至上下波动。其他的(afmhot、铜色、gist_heat 和热色)在 \(L^*\) 函数中存在扭结。在颜色映射的平稳期或扭结区域中表示的数据将导致在该颜色映射值的区域中感知到数据的条带(有关此方面的精彩示例,请参见 [mycarta-banding])。
plot_color_gradients('Sequential (2)',
['binary', 'gist_yarg', 'gist_gray', 'gray', 'bone',
'pink', 'spring', 'summer', 'autumn', 'winter', 'cool',
'Wistia', 'hot', 'afmhot', 'gist_heat', 'copper'])
发散#
对于发散图,我们希望 \(L^*\) 值单调增加到一个最大值,该最大值应接近 \(L^*=100\),然后是 \(L^*\) 值单调递减。我们正在寻找在颜色映射的相对两端大致相等的最小 \(L^*\) 值。通过这些度量,BrBG 和 RdBu 是不错的选择。coolwarm 是一个不错的选择,但它没有跨越很宽的 \(L^*\) 值范围(请参见下面的灰度部分)。
柏林、马那瓜和瓦尼莫是暗模式发散颜色映射,中心处的亮度最小,两端的亮度最大。这些取自 F. Crameri 的 [scientific-colour-maps] 8.0.1 版。
plot_color_gradients('Diverging',
['PiYG', 'PRGn', 'BrBG', 'PuOr', 'RdGy', 'RdBu', 'RdYlBu',
'RdYlGn', 'Spectral', 'coolwarm', 'bwr', 'seismic',
'berlin', 'managua', 'vanimo'])
循环#
对于循环图,我们希望从相同的颜色开始和结束,并在中间与一个对称的中心点相遇。\(L^*\) 应该从开始到中间单调变化,并且从中间到末端反向变化。它应该在增加和减少侧是对称的,并且仅在色调上有所不同。在末端和中间,\(L^*\) 将反转方向,这应该在 \(L^*\) 空间中平滑以减少伪影。有关循环图设计的更多信息,请参阅 [kovesi-colormaps]。
常用的 HSV 颜色映射包含在这组颜色映射中,尽管它对于中心点不是对称的。此外,整个颜色映射中的 \(L^*\) 值变化很大,这使得它不是观看者在感知上查看数据的理想选择。有关此想法的扩展,请参见 [mycarta-jet]。
plot_color_gradients('Cyclic', ['twilight', 'twilight_shifted', 'hsv'])
定性#
定性颜色映射的目标不是成为感知映射,但查看亮度参数可以为我们验证这一点。整个颜色映射中,\(L^*\) 值到处移动,并且显然不是单调增加的。这些不是用作感知颜色映射的理想选择。
plot_color_gradients('Qualitative',
['Pastel1', 'Pastel2', 'Paired', 'Accent', 'Dark2',
'Set1', 'Set2', 'Set3', 'tab10', 'tab20', 'tab20b',
'tab20c'])
杂项#
一些杂项颜色映射具有为其创建的特定用途。例如,gist_earth、ocean 和 terrain 似乎都是为了共同绘制地形(绿色/棕色)和水深(蓝色)而创建的。因此,我们应该看到这些颜色映射中的差异,但多个扭结可能不理想,例如 gist_earth 和 terrain 中。CMRmap 的创建是为了很好地转换为灰度,尽管它在 \(L^*\) 中似乎有一些小的扭结。cubehelix 的创建是为了在亮度和色调上平滑变化,但似乎在绿色色调区域有一个小驼峰。turbo 的创建是为了显示深度和视差数据。
这个颜色映射集合中包含了常用的 jet 颜色映射。我们可以看到,\(L^*\) 值在整个颜色映射中变化很大,这使得它在视觉上表示数据时是一个糟糕的选择。有关此想法的扩展,请参见 [mycarta-jet] 和 [turbo]。
plot_color_gradients('Miscellaneous',
['flag', 'prism', 'ocean', 'gist_earth', 'terrain',
'gist_stern', 'gnuplot', 'gnuplot2', 'CMRmap',
'cubehelix', 'brg', 'gist_rainbow', 'rainbow', 'jet',
'turbo', 'nipy_spectral', 'gist_ncar'])
plt.show()
Matplotlib 颜色映射的亮度#
在这里,我们检查 matplotlib 颜色映射的亮度值。请注意,有关颜色映射的一些文档是可用的 ([list-colormaps])。
mpl.rcParams.update({'font.size': 12})
# Number of colormap per subplot for particular cmap categories
_DSUBS = {'Perceptually Uniform Sequential': 5, 'Sequential': 6,
'Sequential (2)': 6, 'Diverging': 6, 'Cyclic': 3,
'Qualitative': 4, 'Miscellaneous': 6}
# Spacing between the colormaps of a subplot
_DC = {'Perceptually Uniform Sequential': 1.4, 'Sequential': 0.7,
'Sequential (2)': 1.4, 'Diverging': 1.4, 'Cyclic': 1.4,
'Qualitative': 1.4, 'Miscellaneous': 1.4}
# Indices to step through colormap
x = np.linspace(0.0, 1.0, 100)
# Do plot
for cmap_category, cmap_list in cmaps.items():
# Do subplots so that colormaps have enough space.
# Default is 6 colormaps per subplot.
dsub = _DSUBS.get(cmap_category, 6)
nsubplots = int(np.ceil(len(cmap_list) / dsub))
# squeeze=False to handle similarly the case of a single subplot
fig, axs = plt.subplots(nrows=nsubplots, squeeze=False,
figsize=(7, 2.6*nsubplots))
for i, ax in enumerate(axs.flat):
locs = [] # locations for text labels
for j, cmap in enumerate(cmap_list[i*dsub:(i+1)*dsub]):
# Get RGB values for colormap and convert the colormap in
# CAM02-UCS colorspace. lab[0, :, 0] is the lightness.
rgb = mpl.colormaps[cmap](x)[np.newaxis, :, :3]
lab = cspace_converter("sRGB1", "CAM02-UCS")(rgb)
# Plot colormap L values. Do separately for each category
# so each plot can be pretty. To make scatter markers change
# color along plot:
# https://stackoverflow.com/q/8202605/
if cmap_category == 'Sequential':
# These colormaps all start at high lightness, but we want them
# reversed to look nice in the plot, so reverse the order.
y_ = lab[0, ::-1, 0]
c_ = x[::-1]
else:
y_ = lab[0, :, 0]
c_ = x
dc = _DC.get(cmap_category, 1.4) # cmaps horizontal spacing
ax.scatter(x + j*dc, y_, c=c_, cmap=cmap, s=300, linewidths=0.0)
# Store locations for colormap labels
if cmap_category in ('Perceptually Uniform Sequential',
'Sequential'):
locs.append(x[-1] + j*dc)
elif cmap_category in ('Diverging', 'Qualitative', 'Cyclic',
'Miscellaneous', 'Sequential (2)'):
locs.append(x[int(x.size/2.)] + j*dc)
# Set up the axis limits:
# * the 1st subplot is used as a reference for the x-axis limits
# * lightness values goes from 0 to 100 (y-axis limits)
ax.set_xlim(axs[0, 0].get_xlim())
ax.set_ylim(0.0, 100.0)
# Set up labels for colormaps
ax.xaxis.set_ticks_position('top')
ticker = mpl.ticker.FixedLocator(locs)
ax.xaxis.set_major_locator(ticker)
formatter = mpl.ticker.FixedFormatter(cmap_list[i*dsub:(i+1)*dsub])
ax.xaxis.set_major_formatter(formatter)
ax.xaxis.set_tick_params(rotation=50)
ax.set_ylabel('Lightness $L^*$', fontsize=12)
ax.set_xlabel(cmap_category + ' colormaps', fontsize=14)
fig.tight_layout(h_pad=0.0, pad=1.5)
plt.show()
灰度转换#
在彩色绘图中,注意转换为灰度是很重要的,因为它们可能会在黑白打印机上打印。如果没有仔细考虑,您的读者最终可能会得到难以辨认的图表,因为灰度在颜色映射中会不可预测地变化。
灰度转换有很多不同的方法 [bw]。一些较好的方法使用像素 rgb 值的线性组合,但会根据我们感知颜色强度的程度进行加权。转换为灰度的非线性方法是使用像素的 \(L^*\) 值。一般来说,这个问题的适用原则与感知地呈现信息时适用的原则类似;也就是说,如果选择一个在 \(L^*\) 值中单调递增的颜色映射,它将在灰度中以合理的方式打印。
考虑到这一点,我们看到连续颜色映射在灰度中有合理的表示。一些连续2颜色映射具有足够好的灰度表示,但有些(autumn、spring、summer、winter)的灰度变化很小。如果在绘图中使用了这样的颜色映射,然后将绘图打印为灰度,则很多信息可能会映射到相同的灰色值。发散颜色映射大多从外边缘的较深灰色到中间的白色变化。一些(PuOr 和 seismic)在一侧的灰色明显比另一侧深,因此不是很对称。coolwarm 的灰度范围很小,打印出来的图会更均匀,丢失了很多细节。请注意,叠加的带标签的轮廓可以帮助区分颜色映射的一侧与另一侧,因为一旦将绘图打印为灰度,就无法使用颜色。许多定性和杂项颜色映射(例如 Accent、hsv、jet 和 turbo)会在整个颜色映射中从较深到较浅再到较深灰色变化。这将使得查看者在将绘图打印为灰度后无法解释绘图中的信息。
mpl.rcParams.update({'font.size': 14})
# Indices to step through colormap.
x = np.linspace(0.0, 1.0, 100)
gradient = np.linspace(0, 1, 256)
gradient = np.vstack((gradient, gradient))
def plot_color_gradients(cmap_category, cmap_list):
fig, axs = plt.subplots(nrows=len(cmap_list), ncols=2)
fig.subplots_adjust(top=0.95, bottom=0.01, left=0.2, right=0.99,
wspace=0.05)
fig.suptitle(cmap_category + ' colormaps', fontsize=14, y=1.0, x=0.6)
for ax, name in zip(axs, cmap_list):
# Get RGB values for colormap.
rgb = mpl.colormaps[name](x)[np.newaxis, :, :3]
# Get colormap in CAM02-UCS colorspace. We want the lightness.
lab = cspace_converter("sRGB1", "CAM02-UCS")(rgb)
L = lab[0, :, 0]
L = np.float32(np.vstack((L, L, L)))
ax[0].imshow(gradient, aspect='auto', cmap=mpl.colormaps[name])
ax[1].imshow(L, aspect='auto', cmap='binary_r', vmin=0., vmax=100.)
pos = list(ax[0].get_position().bounds)
x_text = pos[0] - 0.01
y_text = pos[1] + pos[3]/2.
fig.text(x_text, y_text, name, va='center', ha='right', fontsize=10)
# Turn off *all* ticks & spines, not just the ones with colormaps.
for ax in axs.flat:
ax.set_axis_off()
plt.show()
for cmap_category, cmap_list in cmaps.items():
plot_color_gradients(cmap_category, cmap_list)
色觉缺陷#
关于色盲有很多可用的信息(例如,[colorblindness])。此外,还有一些工具可用于将图像转换为不同类型的色觉缺陷所看到的样子。
最常见的色觉缺陷形式涉及区分红色和绿色。因此,避免使用同时包含红色和绿色的颜色映射通常会避免许多问题。
参考文献#
脚本的总运行时间:(0 分钟 14.954 秒)