Approche pragmatique de la classification: arbres hiérarchiques, partitionnementsEditions TECHNIP, 2004 - 262 pages La quatrième de couverture indique: "La classification est une branche de l'analyse statistique multidimensionnelle descriptive qui a fait l'objet de très nombreuses publications. Elle connaît, ces dernières années, un renouvellement et un développement considérables avec la multiplication de bases de données de plus en plus importantes, nécessitant une exploration fouillée (data mining) avant d'adopter un modèle probabiliste suggéré par les résultats. Les techniques de classification font appel à une démarche algorithmique et non à des techniques mathématiques complexes: les classes, obtenues après des opérations simples et répétitives, sont souvent faciles à décrire et à caractériser. Ce manuel pratique présente un large éventail de méthodes de classification, des plus classiques aux plus récentes, regroupées en trois types: . classification hiérarchique ascendante et descendante; . construction d'une partition unique fondée sur différentes notions: similarité, densité, modèle probabiliste ou neuronal, graphique; . classification d'un ensemble de variables. La plupart des méthodes implémentées dans plusieurs logiciels statistiques est largement illustrée et l'interprétation des résultats occupe une place importante. Cet ouvrage intéressera les praticiens confrontés, dans leurs travaux, à des données multidimensionnelles importantes et exerçant dans de nombreux domaines: médecine, sciences sociales, industrie, marketing, psychologie, météorologie, documentation, etc. Il s'adressera également aux enseignants, chercheurs, ingénieurs, étudiants et pourra servir de support de cours dans les universités et les grandes écoles." |
Table des matières
Préface Gilbert Saporta | 1 |
Mesures de ressemblance entre individus | 8 |
Mesures de similarité entre variables | 15 |
Propriétés | 21 |
Perte dinertie minimale et saut minimal | 65 |
Application du critère de Ward aux données Ester et | 73 |
Classification par partition | 109 |
Classification conjointe hiérarchie et partition | 129 |
69 | 180 |
Nombre de classes à retenir | 189 |
Caractérisation des classes | 207 |
Classification dun ensemble de variables | 219 |
Classification hiérarchique descendante | 224 |
Logiciels et algorithmes | 241 |
247 | |
251 | |
Expressions et termes fréquents
agrégations ALBU Albumine algorithmes ampicilline analyse factorielle arbre hiérarchique azlocilline barycentre C₁ calcul CARBEN CEFALR centres mobiles CLARANS classe Ck classes de forme classes obtenues classification hiérarchique Cluster Clustering coefficient composantes factorielles compte des outliers correspondant critère d'agrégation critère de Ward DAPM Data Mining DBSCAN définie délai apparition métastases délai de survie densité dimension dissimilarité distance euclidienne distance ultramétrique division effectuée Figure fonction du nombre fournit graphe indices individus initiales itérations k-means KARN Kohonen l'algorithme l'arbre hiérarchique l'échantillon global l'ensemble l'indice LACD logiciel Matrice des corrélations medoids méthode de classification méthodes k-means mezlocilline MFOI modalités mois neurones niveau nmin nœud nombre de classes objets à classer P₁ et P2 Paramètre d'entrée partitionnement partitions P₁ proches représentation graphique Résumé des caractéristiques saut minimal segments similarité sous-ensembles structure suivant tableau de données taille type utilisant valeur propre Valeur-test variables binaires variables latentes variables quantitatives variance vecteur