Ali Bellamine vor 2 Jahren
Ursprung
Commit
706c579f7e
3 geänderte Dateien mit 11 neuen und 10 gelöschten Zeilen
  1. 9 9
      Project_Report.ipynb
  2. 2 1
      bop_scripts/preprocessing.py
  3. 0 0
      bop_scripts/visualisation.py

Datei-Diff unterdrückt, da er zu groß ist
+ 9 - 9
Project_Report.ipynb


+ 2 - 1
scripts/preprocessing.py → bop_scripts/preprocessing.py

@@ -4,6 +4,7 @@
 
 import sqlite3
 import pandas as pd
+import numpy as np
 
 def get_Xy_df (X, y):
     """
@@ -232,7 +233,7 @@ def remove_outliers (X, variables_ranges):
     for key, value in variables_ranges.items():
         outliers_mask = ((X[key] < value[0]) | (X[key] > value[1]))
         outliers[key] = outliers_mask.sum() # Storing the number of outliers
-        X_copy.loc[outliers_mask, key] = pd.NA # Setting outliers to NA
+        X_copy.loc[outliers_mask, key] = np.NaN # Setting outliers to NA
 
     outlier_report = pd.DataFrame.from_dict(outliers, orient="index") \
         .rename(columns={0:"n"}) \

+ 0 - 0
scripts/visualisation.py → bop_scripts/visualisation.py


Einige Dateien werden nicht angezeigt, da zu viele Dateien in diesem Diff geändert wurden.