Ali Bellamine 2 лет назад
Родитель
Сommit
aa07f1e45c
2 измененных файлов с 22 добавлено и 149 удалено
  1. 4 147
      Project_Report.ipynb
  2. 18 2
      scripts/visualisation.py

Разница между файлами не показана из-за своего большого размера
+ 4 - 147
Project_Report.ipynb


+ 18 - 2
scripts/visualisation.py

@@ -55,7 +55,7 @@ def plot_missing_outcome(X, y, features, labels, figsize=(20,10)):
         .groupby("n_NA") \
         .agg(lambda x: x.sum()/x.count())
 
-    fig,ax = plt.subplots(1, 1, figsize=(20,10))
+    fig,ax = plt.subplots(1, 1, figsize=figsize)
     sns.lineplot(
         data=pd.melt(data.reset_index(), id_vars="n_NA",value_vars=data.columns),
         hue="variable",
@@ -65,4 +65,20 @@ def plot_missing_outcome(X, y, features, labels, figsize=(20,10)):
     )
 
     ax.set_xlabel("Nombre de valeurs manquantes")
-    ax.set_ylabel("Pourcentage d'examen prescrit")
+    ax.set_ylabel("Pourcentage d'examen prescrit")
+    ax.set_title("% de prescription de bilans en fonction du nombre de variables manquantes")
+
+def plot_missing_bar(X, features, figsize=(15,10)):
+    fig, ax = plt.subplots(1,1, figsize=figsize)
+
+    data = (X[features].isna()*1).mean().reset_index()
+    sns.barplot(
+        data=data,
+        x="index",
+        y=0,
+        ax=ax
+    )
+
+    ax.set_title("% de valeurs manquantes par variable")
+    ax.set_xlabel("Variable")
+    ax.set_ylabel("% de valeurs manquantes")

Некоторые файлы не были показаны из-за большого количества измененных файлов