Accueil🇫🇷Chercher

Apache Parquet

Apache Parquet est un format de fichiers orienté colonne, initialement développé pour l'écosystème de calcul distribué Apache Hadoop. Il est similaire aux autres formats de fichiers de stockage colonnaires disponibles dans Hadoop, à savoir RCFile et Optimized RCFile. Il est compatible avec la plupart des frameworks de traitement de données de l'environnement Hadoop. Il fournit des schémas efficaces de compression et de codage de données avec des performances améliorées pour gérer des données complexes en masse.

Apache Parquet
Description de l'image Apache Parquet logo.svg.

Informations
Développé par Apache Software Foundation
Première version [1]
DĂ©pĂ´t git-wip-us.apache.org/repos/asf/parquet-mr.git
Écrit en Java
Type Format de fichier (en)
Format de sérialisation de données (d)
Projet de la fondation Apache (d)
Licence Licence Apache version 2.0
Documentation parquet.apache.org/docs
Site web parquet.apache.org

Apache Parquet
Caractéristiques
Extension
.parquet
Développé par
Version initiale
Site web

Historique

Le projet open source qui a abouti à Apache Parquet vient des efforts conjoints entre Twitter[2] et Cloudera[3]. La première version de Apache Parquet 1.0 sort en . Depuis le Apache Parquet devient un projet top-level de la Apache Software Foundation [4] - [5]

Articles connexes

Notes et références

  1. « https://projects.apache.org/json/projects/parquet.json » (consulté le )
  2. « Announcing Parquet 1.0 : Columnar Storage for Hadoop », sur twitter.com (consulté le ).
  3. (en) « Cloudera Blog - », sur Cloudera Blog (consulté le ).
  4. (en) « Apache Parquet paves the way for better Hadoop data storage », sur InfoWorld (consulté le ).
  5. https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces75
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.