正态分布:
若随机变量x听从有一个数学期望为μ,标准差为σ2 的正态分布,记作N(μ,σ)
在其中期待值决策密度函数的部位 ,标准偏差决策遍布的力度,当υ=0,σ=0 时的正态分布是规范正态分布
分辨方式有绘图/k-s检测
绘图:
#导进控制模块 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline #结构一组任意数据信息 s = pd.DataFrame(np.random.randn(1000) 10,columns = ['value']) #画散点图和条形图 fig = plt.figure(figsize = (10,6)) ax1 = fig.add_subplot(2,1,1) # 建立子图1 ax1.scatter(s.index, s.values) plt.grid() ax2 = fig.add_subplot(2,1,2) # 建立子图2 s.hist(bins=30,alpha = 0.5,ax = ax2) s.plot(kind = 'kde', secondary_y=True,ax = ax2) plt.grid()
結果以下:
应用ks检验:
#导进scipy控制模块 from scipy import stats """ kstest方式:KS检测 ,主要参数分别是:待检测的数据信息,检测方式(这儿设成norm正态分布),平均值与标准偏差 結果回到2个值:statistic → D值 ,pvalue → P值 p值超过0.05,为正态分布 H0:样版合乎 H1:样版不符 怎样p>0.05接纳H0 ,相反 """ u = s['value'].mean() # 测算平均值 std = s['value'].std() # 测算标准偏差 stats.kstest(s['value'], 'norm', (u, std))
結果是KstestResult(statistic=0.01441344628501079, pvalue=0.9855029319675546),p值超过0.05为正太分布
本文版权归趣快排营销www.SEOguruBLOG.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ㊣61910465