Parquet Apache tarafından geliştirilmiş bir veri depolama formatıdır. Özellikle büyük veriler üzerinde işlem yaparken faydalar sağlamaktadır. Aws , Google gibi bulut sistemlerinde doğrudan desteklediği bu sistem csv ye göre çok daha yüksek performans sağlamaktadır.
Neden Parquet ?
Ücretsiz ve açık kaynak dosya formatı.
Dil agnostiği.
Sütun tabanlı biçim – dosyalar satır yerine sütuna göre düzenlenir, bu da depolama alanından tasarruf sağlar ve analiz sorgularını hızlandırır.
Genellikle geleneksel OLTP veritabanlarıyla birlikte analitik (OLAP) kullanım örnekleri için kullanılır .
Yüksek verimli veri sıkıştırma ve açma işlemleri sağlar.
Karmaşık veri türlerini ve gelişmiş iç içe geçmiş veri yapılarını destekler