Паркетан файлд схем байгаа юу?

Агуулгын хүснэгт:

Паркетан файлд схем байгаа юу?
Паркетан файлд схем байгаа юу?

Видео: Паркетан файлд схем байгаа юу?

Видео: Паркетан файлд схем байгаа юу?
Видео: Apache паркетийн танилцуулга 2024, Арваннэгдүгээр
Anonim

Parquet файл нь hdfs файл бөгөөд тухайн файлын мета өгөгдлийг агуулсан байх ёстой. Энэ нь баганыг олон файл болгон хуваах, мөн нэг мета өгөгдлийн файлын лавлагааны олон паркет файлтай байх боломжийг олгоно. Мета өгөгдөл нь файлд хадгалагдсан өгөгдлийн схемийг агуулсан.

Би паркетан файлын схемийг хэрхэн үүсгэх вэ?

Паркетан дээжийн өгөгдлийн схемийг үүсгэхийн тулд дараах зүйлийг хийнэ үү:

  1. Haddop/Hive хайрцагт нэвтэрнэ үү.
  2. Энэ нь stdout дээрх схемийг дараах байдлаар үүсгэдэг: -------------- [~] parket-tools schema abc.parquet. зурвас hive_schema { …
  3. Энэ схемийг файл руу хуулна уу. паркет/. нэрлэсэн өргөтгөл.

Паркет нь схемийн хувьслыг дэмждэг үү?

Схемийг нэгтгэх

Протоколын буфер, Avro, хэмнэлттэй адил Паркет нь схемийн хувьсалыг дэмждэг Хэрэглэгчид энгийн схемээс эхэлж, аажмаар багана нэмэх боломжтой. шаардлагатай бол схем. Ийм байдлаар хэрэглэгчид өөр өөр боловч хоорондоо нийцтэй схемтэй олон Паркетын файлтай болж болзошгүй.

Паркетан файлд өгөгдлийн төрөл байдаг уу?

Паркетан файлын өгөгдлийн төрлүүдийг Өгөгдлийн Интеграцийн Үйлчилгээ нь платформууд хооронд өгөгдөл зөөхөд ашигладаг хувиргах өгөгдлийн төрлүүдтэй харуулдаг. Паркет файлыг унших эсвэл бичихийн тулд таны зааж өгсөн Паркетын схемийг жижиг үсгээр бичсэн байх ёстой.

Паркетан файлын бүтэц нь юу вэ?

Паркетан файлууд нь мөрийн бүлгүүд, толгой ба хөл хэсгээс бүрддэг Мөрийн бүлэг бүр ижил багануудын өгөгдлийг агуулна. Мөр бүлэг бүрт ижил багануудыг хамтад нь хадгалдаг: Энэ бүтэц нь асуулгын хурдан гүйцэтгэл, бага I/O (сканнердсан өгөгдлийн хэмжээг багасгах) аль алинд нь маш сайн оновчлогдсон.

Зөвлөмж болгож буй: