注意
转到结尾 下载完整示例代码。
生成多个并排直方图#
本示例沿分类 X 轴绘制不同样本的水平直方图。此外,直方图绘制为关于其 X 位置对称,因此它们非常类似于提琴图。
为了制作这种高度专业化的图表,我们无法使用标准的 hist
方法。相反,我们使用 barh
直接绘制水平条形图。条形图的垂直位置和长度通过 np.histogram
函数计算。所有样本的直方图使用相同的范围 (最小值和最大值) 和 bin 数进行计算,以便每个样本的 bin 位于相同的垂直位置。
选择不同的 bin 计数和大小会显著影响直方图的形状。Astropy 文档有一个关于如何选择这些参数的很好的部分:http://docs.astropy.org/en/stable/visualization/histogram.html
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(19680801)
number_of_bins = 20
# An example of three data sets to compare
number_of_data_points = 387
labels = ["A", "B", "C"]
data_sets = [np.random.normal(0, 1, number_of_data_points),
np.random.normal(6, 1, number_of_data_points),
np.random.normal(-3, 1, number_of_data_points)]
# Computed quantities to aid plotting
hist_range = (np.min(data_sets), np.max(data_sets))
binned_data_sets = [
np.histogram(d, range=hist_range, bins=number_of_bins)[0]
for d in data_sets
]
binned_maximums = np.max(binned_data_sets, axis=1)
x_locations = np.arange(0, sum(binned_maximums), np.max(binned_maximums))
# The bin_edges are the same for all of the histograms
bin_edges = np.linspace(hist_range[0], hist_range[1], number_of_bins + 1)
heights = np.diff(bin_edges)
centers = bin_edges[:-1] + heights / 2
# Cycle through and plot each histogram
fig, ax = plt.subplots()
for x_loc, binned_data in zip(x_locations, binned_data_sets):
lefts = x_loc - 0.5 * binned_data
ax.barh(centers, binned_data, height=heights, left=lefts)
ax.set_xticks(x_locations, labels)
ax.set_ylabel("Data values")
ax.set_xlabel("Data sets")
plt.show()