Data Science, statistique et Machine Learning
Auteurs : TUFFERY Stéphane
Commentaire :
6e édition actualisée
ISBN : 9782710812012
broché 17 x 24 cm 1024 pages
Date de publication : Août 2025
 Ajouter au panier   69 €
                 
                Ajouter au panier   69 €
              
               Dossier de presse• Instantanés Techniques, 12 février 2010.pdf• Revue de l'électricité et de l'électronique, n° 3, mars 2010.pdf• Zentralblatt MATH, 2013.pdf• Courrier des statistiques, n° 121-122, mai-décembre 2007.pdf• Bulletin APMEP, n° 462,janvier-février 2006.pdf• Bulletin de Méthodologie Sociologique, janvier 2006.pdf• Les Echos, janvier 2006.pdf• Revue de Statistique Appliquée, mars 2006.pdf• Short Book Reviews, April 2006.pdf• www.sas.com, juillet 2006.pdf• www.web-datamining.net, juillet 2006.pdf• Revue de Statistique Appliquée, Vol. 148, n° 3-2007.pdf• Bulletin APMEP, n° 485, nov-déc 2009.pdf
Dossier de presse• Instantanés Techniques, 12 février 2010.pdf• Revue de l'électricité et de l'électronique, n° 3, mars 2010.pdf• Zentralblatt MATH, 2013.pdf• Courrier des statistiques, n° 121-122, mai-décembre 2007.pdf• Bulletin APMEP, n° 462,janvier-février 2006.pdf• Bulletin de Méthodologie Sociologique, janvier 2006.pdf• Les Echos, janvier 2006.pdf• Revue de Statistique Appliquée, mars 2006.pdf• Short Book Reviews, April 2006.pdf• www.sas.com, juillet 2006.pdf• www.web-datamining.net, juillet 2006.pdf• Revue de Statistique Appliquée, Vol. 148, n° 3-2007.pdf• Bulletin APMEP, n° 485, nov-déc 2009.pdfDepuis la première édition de cet ouvrage, il y a vingt ans, les méthodes et les outils de la science des données ont beaucoup évolué.
Avec l’arrivée des big data, les bases de données sont de plus en plus volumineuses et variées, provenant de la finance, de la médecine, de l’industrie, des objets connectés, ou encore des textes et images du Web. Mais si l’on parle de « data science » et plus de « data mining », il s’agit toujours d’entraîner des modèles à extraire des informations dans ces bases de données, à détecter des tendances et à faire des prédictions.
Les méthodes de modélisation vont de la statistique la plus théorique à des réseaux de neurones profonds si puissants qu’on parle à leur sujet d’intelligence artificielle. Nous mentionnons les plus récents, les transformers, à la base des grands modèles de langage popularisés par ChatGPT. Malgré la diversité de ces méthodes et de leurs applications, elles s’appuient toutes sur des principes fondamentaux exposés dans l’ouvrage. En apprentissage supervisé, un modèle est une expression mathématique, combinant des fonctions décrites par des paramètres, prenant des données en entrée et donnant en sortie un résultat qui doit être le plus proche possible d’un résultat attendu : pour cela, on ajuste les paramètres à l’aide d’algorithmes d’optimisation, en recherchant aussi la généralité, l’explicabilité et la rapidité de calcul du modèle. En apprentissage non supervisé, un modèle ne vise pas à prédire un résultat mais à détecter des structures dans les données.
Cet ouvrage propose une présentation claire et détaillée des méthodes supervisées (analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, réseaux de neurones, algorithmes génétiques, machines à vecteurs de support, arbres de décision, forêts aléatoires, gradient boosting, etc.) et non supervisées (analyse factorielle, classification automatique, etc.), illustrées de nombreux exemples réalisés avec les logiciels libres R et Python et les logiciels commerciaux SAS et IBM SPSS, lesquels sont aussi comparés en détail dans un chapitre spécifique.
Il aborde aussi les aspects méthodologiques de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation, la comparaison des modèles, et leur insertion dans les processus opérationnels.
Un guide indispensable pour tous ceux qui souhaitent comprendre et maîtriser les fondements et les avancées de la science des données.
Table des matières :
1. Panorama de la data science. 2. Le déroulement d’une étude de data science. 3. L’exploration et la préparation des données. 4. L’utilisation des données commerciales et géodémographiques. 5. Les logiciels de statistique, machine learning et data science. 6. Panorama des méthodes de statistique et de machine learning. 7. L’analyse factorielle. 8. Les méthodes de classification automatique. 9. La détection des règles d’associations. 10. Les méthodes de classement et de régression. 11. L’analyse discriminante linéraire et ses généralisations. 12. Le modèle linéaire et ses généralisations. 13. Le modèle logistique et ses généralisations. 14. Les arbres de décisions. 15. Autres modèles prédictifs. 16. Les méthodes d’ensemble. 17. Les réseaux de neurones artificiels. 18. Une application de la data science : le scoring. 19. Les facteurs de succès d’un projet de data science. 20. Le text mining. 21. Le web mining. Annexes. Bibliographie. Index.
 Modélisation prédictive et apprentissage statistique avec R
									
								Modélisation prédictive et apprentissage statistique avec R
								 Ajouter au panier
						
						45.95 €
						Ajouter au panier
						
						45.95 €
					
					
								
							 Big Data, Machine Learning et apprentissage profond
									
								Big Data, Machine Learning et apprentissage profond
								 Ajouter au panier
						
						45 €
						Ajouter au panier
						
						45 €
					
					
								
							 Analyse statistique des données longitudinales
									
								Analyse statistique des données longitudinales
								 Ajouter au panier
						
						36 €
						Ajouter au panier
						
						36 €
					
					
								
							 Probabilités, analyse des données et statistique
									
								Probabilités, analyse des données et statistique
								 Ajouter au panier
						
						66 €
						Ajouter au panier
						
						66 €
					
					
								
							 Modèles à variables latentes et modèles de mélange
									
								Modèles à variables latentes et modèles de mélange
								 Ajouter au panier
						
						48 €
						Ajouter au panier
						
						48 €
					
					
								
							 0
            0
           
						
           Inscription newsletter
            Inscription newsletter
          

 Partager
			Partager
		 Tweeter
			Tweeter
		 
		 Feuilleter un extrait
Feuilleter un extrait
