Inspiration WIKIPEDIA => L'apprentissage machine, c'est l'étude d'algorithmes capables de s'enrichir à partir de l'expérience. Un jeu de données d'entraînement d'un sur-ensemble permet de préparer un modèle de prédiction ou de décision. L'apprentissage machine est très lié aux études statistiques et à l'optimisation qui ont un connu un grand essor dès les années 1970 et qui trouvent pleinement aujourd'hui leur terrain d'application, vu les puissances de calcul pouvant être mobilisées à ce jour, y compris sur un simple ordinateur doté d'un CPU multicoeur et de grandes capacité mémoire voire de GPU dédié au calcul.
1 – Introduction à l’apprentissage machine
2 – Python dédié à l'apprentissage machine
3 – Apprentissage supervisé et non supervisé
4 – Introduction aux techniques de régression
5 –Exemple d'une simple régression linéaire
6 –Evaluation des modèles de régression linéaire
This sequence defines metrics to evaluate the accuracy of your regression model. Training accuracy is the percentage of correct prediction, but a high training accuracy is not necessarly a good thing. The result can be overfitted. Overfit the model is overlying the trained model to the dataset, which may capture noise and produce a non-generalized model. out of sample accuracy is a percentage of correct prediction on records not present in the data test model. Two strategies :
- training set and testing set mutually exclusive, high out of sample accuracy,
- training data part of the test data => low out of sample accuracy.
7 –Evaluation des métriques des modèles de régression linéaire
Evaluation metrics help to evaluate the performance of the régression méthod. We must compare actuel value to predicted value to calculate the accuracy of the prediction model. Metrics provide insight in the data. For evaluation of metrics we use MAE, MSE, RMSE, RAE (Relative Absolute Error), RSE, R2 .
8 –Multiple linear régression
Several variables are used to predict the dependant variable.
$$y= \theta_0 + \theta_1 x_1 + \theta_2 x_2 + ...$$
9 –Régression non linéaire
Polynomial function are used to predict the dependant variable.
10 –Introduction à la classification
Different classification methods survey and algorithm presentation : Decision Tree, Naïve Bayes, Linear discriminant analysis, K-N Neighbour, Logistic Regression, , Neural NetWork, SVM
11 –Algorithm KNN
A first an simple KNN approach
11 –Evaluation metrics in classification
Howto evaluate the accuracy of your classification
12 –Decision Tree
What is a decision tree ?
13 – Intro to logistic regression
14 –Logistic versus linear regression
15 –Logistic regression training
15 –Support Vecteur Machine
16 –Intro to clustering
17 –K-means cluster
18–More on K-means cluster
19–Hierarchal cluster
19–More on Hierarchal cluster
19–Density based clustering cluster
20–Intro to recommander system
21–Content based recommander system
21–Collaborative filtering recommander system