Vizualizacija rezultata
Pored svog znanja koje je potrebno za uspešnu implementaciju Hadoop-a još nešto je jako bitno, a to je vizualizacija rezultata obrade podataka ili prikaz informacija na adekvatan način. Ovo je jako bitno kako bi donosioci odluka u firmama, koji ne poznaju detalje Hadoop-a, mogli valjano da pročitaju rezultate i u odnosu na njih donose odluke.
Iskren da budem nisam puno zalazio u ovaj deo problematike, ali mogu da opišem neka rešenja koja sam na kratko testirao i neke ideje koje još uvek realizujem. Razmišljao sam da li uopšte da pišem tekst na ovu temu, ali kako vreme odmiče shvatam da je jako bitno i prikazati rezultate, pogotovo onima koji su na pozicijama sa kojih se donose odluke. Njima je bitniji rezultat nego neki tamo Flume ili Hive kod, što je i logično.
Postoje dva puta koja vode do valjane vizualizacije podataka koji su prethodno obrađeni Hadoop-om, odnosno nekim alatom iz Hadoop ekositema. Prvi je neko besplatno rešenje, a drugi, naravno, ono koje se plaća. Postoje razlike između ova dva rešenja, i jedno i drugo imaju mane i prednosti. Sigurno besplatno rešenje zvuči primamljivo jer ne moramo da izdvojimo novac za njega, ali druga strana medalje je da je obično teže održavati i koristiti takav alat. Nešto što sam lično probao bio je D3.js. Nisam puno koristio ovu Java Script biblioteku, ali je poslužila za nekoliko prezentacija. Prednost je što je potpuno besplatna i nudi gotovo sve što vam je potrebno za vizualizaciju. Mana korišćenja je, bar u mom slučaju, to što pored svega što sam radio morao sam malo da se udubim i u kod Java Scripta, što nije naivno, a nije ni baš ni srodno sa Hadoop alatima. Možda je u sistemima koji mogu da priušte i stručnjaka samo za ovu tehnologiju lakše, ali meni ne. Za test je sasvim u redu i ako imate vremena da se “igrate” sa D3. Drugi put kojim možete da krenete je da platite neko rešenje. Alati koji se ističu su Tableau, naravno Microsoft alati za vizualizaciju i BI. Možda je pogrešno reći ističu, to zavisi od sistema do sistema, iskreno, ja sam probao ova dva jer pružaju besplatan probni period. Najviše sam radio sa Microsoft alatima jer je Hortonworks partner sa Microsoftom i ima dobru podršku u vidu dodataka za integraciju HDP-a i Microsoft alata. Mogu da preporučim Office 365 uz koji dolazi Power BI koji je odličan izbor za testiranje, ali i integraciju sa Hadoop-om.
Lično ne mogu puno da pišem o ovoj temi, ali mi je bilo bitno da makar samo pomenem deo ove priče radi šire slike. Mogu da vam preporučim i dva bloga koji su odličan dodatak celoj priči. Jedan od njih je blog SQL user grupe Beograd koji možete naći ovde. Možete posetiti i neko od predavanja koja organizuju, a za koja smatrate da mogu da se povežu sa Hadoop-om. Na tom blogu sam napisao i jedan tekst pod nazivom “Hadoop i sveprisutno računarstvo” koji je kratak osvrt na predavanje koje sam tamo održao. Takođe, što se tiče vizualizacije podataka i BI preporučujem blog koji možete naći ovde. Tu su tekstovi o office 365 i još neki interesantni tekstovi.
Ovaj tekst nije bio puno vezan za Hadoop, ali sam morao i ovo makar da dotaknem. Sledeći tekstovi su nastavak o Hadoop-u, HBase-u i malo više o tome kako prikupiti podatke uz pomoć Flume-a i Sqoop-a. I moram da se izvinim zbog malo duže pauze između ovog i prethodnog teksta, ali sada nastavljamo da hadupujemo.