Les étudiants de la cohorte 2020/2021 sont depuis le début de cette semaine immergés dans les fondamentaux de l'Advanced Data Science par le Pr Ndèye Niang Keita du Conservatoire National des Arts et Métiers (CNAM), France.
L'objectif principal de ce cours par vidéoconférence est d'initier les étudiants au traitement des données volumineuses et non étiquetées, à analyser et à trouver tous les modèles inconnus ou caractéristiques importantes. Le cours indique également les méthodes d'apprentissage automatique à utiliser pour ce type de données.
«Dans la vraie vie, trouver des données annotées par des experts humains est coûteux, difficile et chronophage pour les entreprises. C'est pourquoi la plupart des entreprises préfèrent les données non étiquetées où elles n'ont pas besoin d'investir du temps et des ressources dans les humains qui étiqueteront les données », a expliqué le professeur Ndèye.
Pendant trois semaines, elle présentera aux étudiants certains aspects de l'analyse du Big Data et des méthodes d'apprentissage non supervisé telles que l'analyse factorielle, le regroupement pour les variables quantitatives et qualitatives.
Assisté par Berthine Nyunga Mpinda, tutrice de l'AIMS Cameroun, le professeur Ndèye met davantage l'accent sur les méthodes populaires telles que l'analyse en composantes principales (ACP) utilisées pour la visualisation des données, la réduction de dimension ou le prétraitement des données ainsi que le clustering K-means et le clustering hiérarchique utilisé pour le clustering de données. Ces méthodes, dit-elle, sont si importantes pour les étudiants dans leur objectif de carrière car elles les aideront à analyser le Big Data pour différents types de variables, à réduire la dimensionnalité et à regrouper les données en fonction de leurs similitudes.
Au cours de ces trois semaines, les étudiants appliqueront également ces méthodes à des problèmes de la vie réelle en utilisant des ensembles de données de segmentation client, de fabrication et de marketing pour soutenir le processus décisionnel des entreprises afin de consolider leur position sur le marché, et également augmenter la valeur de leurs produits. Et services.
Le professeur Ndeye Niang Keita est maître de conférences en analyse de données au Conservatoire national des arts et métiers (CNAM) en France. Elle est également membre de l'équipe de recherche MSDMA «Méthodes statistiques pour l'exploration et l'apprentissage des données» du CEDRIC (Centre de recherche en informatique et communication) et chargée de cours à l'Institut de statistiques de l'Université Paris VI.
Elle a obtenu un BSc en mathématiques, MSc. en mathématiques appliquées, MSc. en Méthodes de Calcul et Modèles Mathématiques de l'Université Paul Sabatier à Toulouse. Elle est titulaire d'un doctorat en statistique de l'Université Paris IX Dauphine.
Le professeur Ndèye Niang est un spécialiste de l'analyse de données, de l'exploration de données et de l'analyse de Big Data. Après avoir terminé sa thèse sur les méthodes multidimensionnelles pour le contrôle statistique des processus, elle a travaillé sur l'application des méthodes d'analyse multi-tableaux au contrôle qualité et sur l'analyse des variables qualitatives dans l'exploration de données, en particulier sur l'analyse des correspondances et plusieurs méthodes de discrimination, ainsi que sur le clustering. de variables avant d'extraire des règles d'association dans de grandes bases de données.
A travers plusieurs thèses de maîtrise et encadrement de doctorat, elle collabore avec de nombreuses entreprises et centres de recherche pour l'application de méthodes statistiques avancées à des problèmes réels dans les industries automobiles, la qualité de l'air intérieur, la gestion des retours clients et les effets secondaires des médicaments, entre autres. Elle travaille actuellement sur le développement de méthodes non supervisées et supervisées pour les données multi-blocs.