Connaitre le sujet, les données









Importing Libraries and Loading Dataset





Visualisation of Relationship between output and Different Input





Correcting fare data









Checking for Nan Values





New data fit for Modeling
training_data=add_title_and_encode(training_data)
test_data=add_title_and_encode(test_data)


Filling Missing age of a person based on his/her Title




Adding new Features


Splitting Data

Using Logistic Regression

Predicting and Evaluating


Using Random Forest












L’accuracy est basée sur la matrice de confusion. Pour rappel, la matrice de confusion est composée de 4 valeurs :

Accuracy: Justesse, exactitude
Precision: tous les éléments visés sont regroupés

