소스 검색

Mise à jour de la dataviz

Ali Bellamine 3 년 전
부모
커밋
aa07f1e45c
2개의 변경된 파일22개의 추가작업 그리고 149개의 파일을 삭제
  1. 4 147
      Project_Report.ipynb
  2. 18 2
      scripts/visualisation.py

파일 크기가 너무 크기때문에 변경 상태를 표시하지 않습니다.
+ 4 - 147
Project_Report.ipynb


+ 18 - 2
scripts/visualisation.py

@@ -55,7 +55,7 @@ def plot_missing_outcome(X, y, features, labels, figsize=(20,10)):
         .groupby("n_NA") \
         .agg(lambda x: x.sum()/x.count())
 
-    fig,ax = plt.subplots(1, 1, figsize=(20,10))
+    fig,ax = plt.subplots(1, 1, figsize=figsize)
     sns.lineplot(
         data=pd.melt(data.reset_index(), id_vars="n_NA",value_vars=data.columns),
         hue="variable",
@@ -65,4 +65,20 @@ def plot_missing_outcome(X, y, features, labels, figsize=(20,10)):
     )
 
     ax.set_xlabel("Nombre de valeurs manquantes")
-    ax.set_ylabel("Pourcentage d'examen prescrit")
+    ax.set_ylabel("Pourcentage d'examen prescrit")
+    ax.set_title("% de prescription de bilans en fonction du nombre de variables manquantes")
+
+def plot_missing_bar(X, features, figsize=(15,10)):
+    fig, ax = plt.subplots(1,1, figsize=figsize)
+
+    data = (X[features].isna()*1).mean().reset_index()
+    sns.barplot(
+        data=data,
+        x="index",
+        y=0,
+        ax=ax
+    )
+
+    ax.set_title("% de valeurs manquantes par variable")
+    ax.set_xlabel("Variable")
+    ax.set_ylabel("% de valeurs manquantes")

이 변경점에서 너무 많은 파일들이 변경되어 몇몇 파일들은 표시되지 않았습니다.