数据清洗


原文链接: 数据清洗

异常值检测 - JingYi的专栏 - CSDN博客

pandas

再删除缺失值大于90%的变量:

`df.dropna(thresh = len(df) * 0.1 , axis=1,inplace=True)`

df.dropna(thresh=np.int((100-percent_NA_cols_required)*(len(df.columns)/100)),inplace=True)

`