Ali Bellamine 2 vuotta sitten
vanhempi
commit
706c579f7e
3 muutettua tiedostoa jossa 11 lisäystä ja 10 poistoa
  1. 9 9
      Project_Report.ipynb
  2. 2 1
      bop_scripts/preprocessing.py
  3. 0 0
      bop_scripts/visualisation.py

Tiedoston diff-näkymää rajattu, sillä se on liian suuri
+ 9 - 9
Project_Report.ipynb


+ 2 - 1
scripts/preprocessing.py → bop_scripts/preprocessing.py

@@ -4,6 +4,7 @@
 
 import sqlite3
 import pandas as pd
+import numpy as np
 
 def get_Xy_df (X, y):
     """
@@ -232,7 +233,7 @@ def remove_outliers (X, variables_ranges):
     for key, value in variables_ranges.items():
         outliers_mask = ((X[key] < value[0]) | (X[key] > value[1]))
         outliers[key] = outliers_mask.sum() # Storing the number of outliers
-        X_copy.loc[outliers_mask, key] = pd.NA # Setting outliers to NA
+        X_copy.loc[outliers_mask, key] = np.NaN # Setting outliers to NA
 
     outlier_report = pd.DataFrame.from_dict(outliers, orient="index") \
         .rename(columns={0:"n"}) \

+ 0 - 0
scripts/visualisation.py → bop_scripts/visualisation.py


Kaikkia tiedostoja ei voida näyttää, sillä liian monta tiedostoa muuttui tässä diffissä