Accueil🇫🇷Chercher

Data profiling

Le profiling est le processus qui consiste à récolter les données dans les différentes sources de données existantes (bases de données, fichiers,...) et à collecter des statistiques et des informations sur ces données. C'est ainsi très proche de l'analyse des données.

Objectifs

Le profiling a pour objectif :

  • d'identifier les donnĂ©es rĂ©utilisables pour d'autres fins ;
  • d'avoir des mesures sur la qualitĂ© des donnĂ©es et sur la conformitĂ© par rapport aux standards de l'entreprise ;
  • d'Ă©valuer les risques engendrĂ©s par l'intĂ©gration de ces donnĂ©es dans de nouvelles applications ;
  • d'Ă©valuer si les mĂ©tadonnĂ©es dĂ©crivent correctement les donnĂ©es sources ;
  • d'avoir une bonne comprĂ©hension de l'enjeu des donnĂ©es sources sur les projets Ă  venir afin d'anticiper de mauvaises surprises. La dĂ©couverte tardive de problèmes de donnĂ©es peut entrainer des dĂ©passements de dĂ©lais et de budget sur un projet, ex. : avoir Ă  modifier le format d'un code Ă  des centaines d'endroits sur son projet mais aussi Ă©ventuellement sur des projets connexes en cours dĂ©veloppement, avoir Ă  reconstruire les rĂ©fĂ©rentiels associĂ©s, avoir Ă  rediscuter et Ă  revalider des documents contractuels…
  • d'avoir une vue globale des donnĂ©es pour permettre la gestion des donnĂ©es de rĂ©fĂ©rence ou la gouvernance des donnĂ©es afin de renforcer la qualitĂ© des donnĂ©es.

Notes et références

    Lien externe

    Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.