Big Data + Cyberbezpiecze艅stwo = Data-Driven SOC

Jak pewnie wiesz, na co dzie艅 艂膮cz臋 Big Data i Cybersecurity. Czy taka fuzja ma sens? Niekt贸rzy nie do ko艅ca rozumieli czemu przechodz臋 do CSIRT’u. Przecie偶 to r贸偶ne bajki. Oj byli w b艂臋dzie… wolumen danych jest ogromny. Jest te偶 sporo wyzwa艅. Zapraszam Ci臋 do mojego wywodu na ten temat 馃槈.

Czytaj dalej 鈥濨ig Data + Cyberbezpiecze艅stwo = Data-Driven SOC鈥

Stream Processing – There’s no time like the present [nagranie]

Nagranie z mojego wyst膮pienia o przetwarzaniu strumieniowym w ramach DataOps Poland. Klasyczne podej艣cie polegaj膮ce na przetwarzaniu wsadowym nie zawsze si臋 sprawdza. Warto艣膰 informacji maleje wraz z up艂ywem czasu. Musimy wybra膰 kompromis pomi臋dzy szybko艣ci膮, a dok艂adno艣ci膮 wynik贸w. Z nagrania dowiesz si臋, dlaczego warto zainteresowa膰 si臋 przetwarzaniem strumieniowym i jakie niesie ze sob膮 problemy.

Czytaj dalej 鈥濻tream Processing – There’s no time like the present [nagranie]鈥

Big Data w Cyberbezpiecze艅stwie (Podcast)

Mia艂em przyjemno艣膰 by膰 go艣ciem podcastu Stacja IT. Zapraszam do przes艂uchania, szczeg贸lnie je艣li interesuje Ci臋 Big Data i/lub Cyberbezpiecze艅stwo.

https://stacja.it/podcast/2020-11-06-maciej-szymczyk-big-data-w-cyberbezpieczenstwie.html

P贸艂tora miliarda hase艂 w Spark – cz臋艣膰 1 – czyszczenie

Tym razem do piaskownicy wkracza Apache Spark. Zajmiemy si臋 prostym, ale poka藕nym zbiorem maili i hase艂 z r贸偶nych wyciek贸w danych. W tym przyk艂adzie b臋d臋 u偶ywa艂 DataFrames w Spark 2.0. 艢rodowisko na kt贸rym dzia艂a艂em to HDInsight na Azure.

Czytaj dalej 鈥濸贸艂tora miliarda hase艂 w Spark – cz臋艣膰 1 – czyszczenie鈥

Big Data to 3 s艂owa

Co to jest w og贸le Big Data? S艂yszymy o systemach, technologiach, rozwi膮zaniach鈥 a nawet o systemach klasy Big Data. Jest to troch臋 takie s艂owo wytrych, buzzword, kt贸re nabra艂o popularno艣ci i si臋 “sprzedaje”. Poni偶ej opisa艂em to co kryje si臋 pod tym terminem wed艂ug mnie.

Czytaj dalej 鈥濨ig Data to 3 s艂owa鈥