Koalas, czyli PySpark w przebraniu Pandas

Jednym z podstawowych narz臋dzi Data Scientist jest Pandas. Niestety nadmiar danych mo偶e znacznie utrudni膰 nam zabaw臋. Dlatego powsta艂o Koalas. Biblioteka umo偶liwiaj膮ca korzystanie z Apache Spark w taki spos贸b, jakby艣my robili to za pomoc膮 Pandas.

Czytaj dalej 鈥濳oalas, czyli PySpark w przebraniu Pandas鈥

Dlaczego Elasticsearch k艂amie? Jak dzia艂a Elasticsearch?

Elasticsearch zaskakuje nas swoimi mo偶liwo艣ciami i szybko艣ci膮 dzia艂ania, ale czy zwracane wyniki s膮 prawid艂owe? W tym wpisie dowiesz si臋 jak Elasticsearch dzia艂a pod mask膮 i dlaczego zwracane agregacje s膮 pewnego rodzaju przybli偶eniem.

Czytaj dalej 鈥濪laczego Elasticsearch k艂amie? Jak dzia艂a Elasticsearch?鈥

Analiza Danych Transportu Miejskiego Warszawy w Kibana i Elasticsearch

W poprzednim wpisie udokumentowa艂em utworzenie przep艂ywu danych wykorzystuj膮cego technologie takie jak Kafka, Kafka Streams, Logstash i Elasticsearch. Po kilku dniach pracy mam ju偶 wystarczaj膮c膮 ilo艣膰 danych, aby przekona膰 si臋 jakie mo偶liwo艣ci analizy danych transportu miejskiego umo偶liwia Elasticsearch i Kibana.

Czytaj dalej 鈥濧naliza Danych Transportu Miejskiego Warszawy w Kibana i Elasticsearch鈥