Delta Lake w Pigu艂ce (czyli o podr贸偶ach w czasie)

Delta Lake zdobywa ostatnio coraz wi臋ksza popularno艣膰. S艂ycha膰 o nim na konferencjach na ca艂ym 艣wiecie. W tym artykule przyjrzymy si臋 jakie problemy rozwi膮zuje.

Czytaj dalej 鈥濪elta Lake w Pigu艂ce (czyli o podr贸偶ach w czasie)鈥

P贸艂tora miliarda hase艂 w Spark 鈥 cz臋艣膰 2 鈥 formaty danych

W poprzedniej cz臋艣ci, po przygotowaniu danych w Apache Spark-u i zapisaniu ich w formacie Parquet, wida膰 by艂o spor膮 popraw臋 w czasie wykonania zapyta艅. Czy by艂o to konieczne? Jakie s膮 inne formaty danych i kt贸ry wypada korzystniej? Przekonajmy si臋.

Czytaj dalej 鈥濸贸艂tora miliarda hase艂 w Spark 鈥 cz臋艣膰 2 鈥 formaty danych鈥