Czytelny Kod Scala w Apache Spark (4 podej艣cia)

Jupyter i Apache Zeppelin to dobre miejsce na eksperymentowanie z danymi. Niestety, specyfika notebook’贸w nie zach臋ca do organizacji kodu, a w tym jego dekompozycji i czytelno艣ci. Mo偶emy przekopiowa膰 kom贸rki do Intellij IDEA i zbudowa膰 JAR’a, ale efekt b臋dzie taki sobie. W artykule dowiesz si臋 jak napisa膰 czytelny kod Scala Apache Spark w Intellij IDEA.

Czytaj dalej 鈥濩zytelny Kod Scala w Apache Spark (4 podej艣cia)鈥

Jak zacz膮膰 z Apache Spark i Cassandra

Apache Cassandra to specyficzna baza danych. Skaluje si臋 (uwaga) liniowo. Ma to swoj膮 cen臋: specyficzne modelowanie tabel, konfigurowalna sp贸jno艣膰 i ograniczona analityka. Apple wykonuje miliony operacji na sekund臋 na ponad 160 tys. instancjach Cassandry. Gromadzi przy tym ponad 100 PB danych. Ograniczon膮 analityk臋 mo偶na “wyleczy膰” wykorzystuj膮c Apache Spark i connector od DataStax i o tym jest ten wpis.

Czytaj dalej 鈥濲ak zacz膮膰 z Apache Spark i Cassandra鈥