22.23.24.25.盒须图(boxplot)、棉棒图(StemPlot;Lollipo。。。
22.盒须图(boxplot)
23.棉棒图(Stem Plot; Lollipop plot)
24.极坐标图
25.雷达图(Radar Chart)
22.盒须图(boxplot)
箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显⽰出⼀组数据的最⼤值、最⼩值、中位数、及上下四分位数。
购置税计算最⼩值(minimum)
下四分位数(Q1)
中位数(Median,也就是Q2)
上四分位数(Q3)
最⼤值(maximum)
四分位间距(IQR)
箱形图将数据分为⼏个部分,每个部分包含该集中⼤约25%的数据。
请注意,上图代表的数据是完美的正态分布,⼤多数箱形图均不符合这种对称性(每个四分位数的长度相同)。
箱形图形状将显⽰统计数据集是正态分布还是偏斜。
箱形图很有⽤,因为它们显⽰了数据集中的异常值(outliers,离值)。离值是在数值上与其余数据相距遥远的观测值。
查看箱形图时,离值定义为位于箱形图whiskers之外的数据点。
张雨生去世现场import matplotlib
import matplotlib.pyplot as plt
import numpy as np
# Fixing random state for reproducibility
np.random.seed(19680801)
# fake up some data
spread = np.random.rand(50)*100
center = np.ones(25)*50
flier_high = np.random.rand(10)*100+100来自星星的你宋茜
flier_low = np.random.rand(10)*-100
data = np.concatenate((spread, center, flier_high, flier_low))
fig1, ax1 = plt.subplots()
ax1.set_title('Basic Plot')
ax1.boxplot(data)
香菇酱plt.show()
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
# Fixing random state for reproducibility
np.random.seed(19680801)
# fake up some data
spread = np.random.rand(50)*100
center = np.ones(25)*50
flier_high = np.random.rand(10)*100+100
flier_low = np.random.rand(10)*-100
data = np.concatenate((spread, center, flier_high, flier_low))
fig2, ax2 = plt.subplots()
ax2.set_title('Notched boxes')
ax2.boxplot(data, notch=True)
plt.show()
新农村指导员总结import matplotlib
import matplotlib.pyplot as plt
import numpy as np
# Fixing random state for reproducibility
np.random.seed(19680801)
# fake up some data
spread = np.random.rand(50)*100
center = np.ones(25)*50
flier_high = np.random.rand(10)*100+100
flier_low = np.random.rand(10)*-100
data = np.concatenate((spread, center, flier_high, flier_low))
green_diamond =dict(markerfacecolor='g', marker='D')
fig3, ax3 = plt.subplots()
ax3.set_title('Changed Outlier Symbols')
打工人梗刷屏ax3.boxplot(data, flierprops=green_diamond)
plt.show()
发布评论