Ali Bellamine hace 2 años
padre
commit
706c579f7e
Se han modificado 3 ficheros con 11 adiciones y 10 borrados
  1. 9 9
      Project_Report.ipynb
  2. 2 1
      bop_scripts/preprocessing.py
  3. 0 0
      bop_scripts/visualisation.py

La diferencia del archivo ha sido suprimido porque es demasiado grande
+ 9 - 9
Project_Report.ipynb


+ 2 - 1
scripts/preprocessing.py → bop_scripts/preprocessing.py

@@ -4,6 +4,7 @@
 
 import sqlite3
 import pandas as pd
+import numpy as np
 
 def get_Xy_df (X, y):
     """
@@ -232,7 +233,7 @@ def remove_outliers (X, variables_ranges):
     for key, value in variables_ranges.items():
         outliers_mask = ((X[key] < value[0]) | (X[key] > value[1]))
         outliers[key] = outliers_mask.sum() # Storing the number of outliers
-        X_copy.loc[outliers_mask, key] = pd.NA # Setting outliers to NA
+        X_copy.loc[outliers_mask, key] = np.NaN # Setting outliers to NA
 
     outlier_report = pd.DataFrame.from_dict(outliers, orient="index") \
         .rename(columns={0:"n"}) \

+ 0 - 0
scripts/visualisation.py → bop_scripts/visualisation.py


Algunos archivos no se mostraron porque demasiados archivos cambiaron en este cambio