Nie masz 艣rodowiska? Docker na pomoc!

Dlaczego Docker? Wiele os贸b pyta mnie, czy do nauki potrzebne jest specjalne 艣rodowisko lub klaster. Klaster na pewno jest fajn膮 opcj膮. Mimo wszystko sporo mo偶liwo艣ci daje pojedyncza maszyna z Dockerem na pok艂adzie.

Czytaj dalej 鈥濶ie masz 艣rodowiska? Docker na pomoc!鈥

Kto najlepiej 膰wierka? Podstawy Graphframes + Tweepy

S艂ysza艂e艣/a艣 o Apache Graphframes? Teoria graf贸w to nie tylko ich w艂asno艣ci, ale i algorytmy. Przekszta艂cenie danych do modelu grafowego umo偶liwia zastosowanie niekt贸rych z nich. W tym wpisie pobierzemy dane “followers贸w” z Twittera i wykonamy par臋 prostych algorytm贸w w Graphframes w PySparku.

Czytaj dalej 鈥濳to najlepiej 膰wierka? Podstawy Graphframes + Tweepy鈥

Obliczanie pr臋dko艣ci w Apache Spark – GPS komunikacji miejskiej

W poprzednim po艣cie utworzyli艣my strumie艅 danych lokalizacji pojazd贸w komunikacji miejskiej na jednym z topic贸w w Apache Kafka. Teraz dorwiemy si臋 do tego strumienia z poziomu Apache Spark, zapiszemy troch臋 danych na HDFS i zobaczymy czy da si臋 co艣 z nimi zrobi膰.

Czytaj dalej 鈥濷bliczanie pr臋dko艣ci w Apache Spark – GPS komunikacji miejskiej鈥