- Importing the libraries
%matplotlib inline: With this backend, the output of plotting commands is displayed inline within frontends like the Jupyter notebook, directly below the code cell that produced it. When using the ‘inline’ backend, your matplotlib graphs will be included in your notebook, next to the code. It may be worth also reading .
- Loading the Dataset
- Prendre le temps d’analyser ce que représente chaque variable, leur type. Comprendre le genre de questions que l’on peut en extraire, traiter! Entrer dans le contexte du problème.
- EDA (Exploratory Data Analysis)
- df.info()
- df….value_counts(): rechercher les extrèmes, se faire une visualisation des regroupements
- plt.show(): graphiques, rendre visuelles les données
- Preparation for modelling
- Plusieurs essais de types de graphiques peuvent être nécessaires pour faire ressortir la bonne information, l’information intéressante!
- Scaling
- SVC Modelling
- Entrainement du modèle
- Tests de fiabilité
- Matrice de confusion (Vrai/Faux Positifs/Négatifs)
- Hyperparameter Optimization with Python (Scalable Linear Support Vector)































































































Il semble que la librairie Seaborn contient maintenant des fonctions intégrées qui nécessitaient MathPlotlib, maintenant inutiles!!







The drop() method removes the specified row or column.
Inplace: Optional, default False. If True: the removing is done on the current DataFrame. If False: returns a copy where the removing is done.
Axis parameter, which allows specifying the operation’s target: the entire array, column-wise, row-wise, or other dimensions.






Le biais est considéré comme Lne caractéristique d’une question ou d’une démarche qui a pour conséquence de générer des erreurs dans les résultats ou l’interprétation des résultats de l’enquête.
Dans une enquête statistique, une question est dite biaisée si les données recueillies ne reflètent pas les caractéristiques de la population étudiée.
Trade-off: compromis




































CV = Cross Validation


















(* Méthodes de calcul de distance *)
































































Dans Jupyter: touche »A » et touche « B » insèrent des cellules avant et après rapidement!!



















































Une réflexion sur “-06-Machine Learning: Intro + Synthèse (using Titanic)”