Data Science Srbija Companies: Content Insigths
Content Insights analitika služi za napredno merenje uspešnosti pisanog sadržaja u online medijima. Proizvod je okrenut pre svega novinarima, urednicima sadržaja i onlajn medijima. U stanju je da izmeri nivo uključenosti čitalaca, vreme koje provedu čitajući sa pažnjom, uspešnost sadržaja u kontekstu privlačenja nove publike na sajt, kao i u kontekstu negovanja lojalne publike.
U srcu analitike nalazi se napredni algoritam pod nazivom CPI (Content Performance Indicator) koji prepoznaje tri modela ponašanja čitalaca i prema tome – “ocenjuje” svaki tekst vrednošću od 0 do 1000, pri čemu se 500 računa kao prag, a sve iznad toga kao natprosečno performiranje teksta.
Data science u Content Insights -u
Content Insights okuplja grupu različitih ljudi sa različitim iskustvima koja ima cilj da novinarskoj industriji ponudi nešto revolucionarno u sferi merenja kvaliteta i uspešnosti sadržaja. U kompaniji postoji zasebno data science odeljenje u kojem rade iskusni stručnjaci čiji rad značajno utiče na dalji razvoj i usavršavanje performansi proizvoda.
U Content Insights-u, upotreba data science-a je raznovrsna sa fokusom na optimalna rešenja. Optimizacija se vrši između kompleksnosti rešenja, kvaliteta rezultata i cene rešenja. Neki od projekata, gde je upotreba data science-a ključna su:
- Značajna promena metrika: kada posmatramo veb metrike nije dovoljno posmatrati relativnu promenu metrika (jer i relativna promena može biti relativna). Na primer, da bismo utvrdili da li je skok sa 1.24 minuta po stranici na 1.35 minuta značajan, mi koristimo T-test.
- Ekstrakcija ključnih reči: ovo spada u NLP domen gde nijedno dostupno rešenje ne ispunjava kriterijume specifične za našu nišu poslovanja pa smo tako morali razviti svoj algoritam za ekstrakciju značajnih ključnih reči iz medijskih članaka.
- Grupisanje članaka: jedna od standardnih problematika vezana za analitiku veb sadržaja. U CI je radimo na više različitih načina u zavisnosti od upotrebe rezultata. Ponekad je to hijerarhijska klasterizacija, a nekada analiza na osnovu sličnosti sadržaja članaka. Takođe, za različite jezike pristup može da se razlikuje zbog specifičnosti jezika.
- Detekcija anomalija: koristi se kao ispomoć u filtriranju i pripremi podataka. Na primer, podaci koji dolaze od društvenih mreža često imaju haotično ponašanje kada je potrebno detektovati da li je to ponašanje “prirodno” ili je rezultat grešaka u prikupljanju podataka.
- Put čitalaca: u ovom slučaju se radi o jedinstvenom konceptu atribucije uticaja na konverzije gde smo razvili sopstveni algoritam koji uzima u obzir kompletno putovanje čitalaca, od novih do lojalnih, uključujući i specifičnosti posećenih članaka na tom putovanju.
- Najuticajnija promena: u moru podataka i metrika, teško je pronaći šta je relevantno u kojem slučaju, te smo u tu namenu razvili algoritam koji radi upravo to. Ovaj algoritam je u stanju da detektuje i izdvoji relevantne promene i skrati vreme eksploracije podataka.
Projekti u fokusu u Content Insights-u
- Topic detection (tzv. cultural mapping)
- Content recommendation alat koji se bazira na algoritmu Loyalty CPI
Topic detection podrazumeva razvijanje posebnog alata koji bi kroz topic klasterizaciju, krajnjim korisnicima pomogao da jasno uoče koje su trenutno najaktuelnije teme koje okupiraju pažnju definisane ciljne grupe. Pritom se koriste napredne metrike koje opisuju ponašanje čitalaca, te mere koliko je jedna tema popularna i uspešna u kontekstu privlačenja i održavanja pažnje publike i podsticanja njihove lojalnosti. Koji od tri moguća modela (exposure, engagement, loyalty) će biti u fokusu zavisi od poslovnog modela korisnika.
Zahvaljujući jasno vizualizovanim podacima i uvidima, korisnici će moći da mapiraju trenutno najaktuelnije teme (tzv. cultural conversations), da bolje razumeju svoje čitaoce, te da dodatno optimizuju svoj sadržaj zarad što bolje vidljivosti i povećanja percepcije o vrednosti njihovog brenda.
Kada je reč o content recommendation alatu, u pitanju je poseban widget koji se postavlja na sajt onlajn medija. Ovaj widget čitaocima preporučuje članke za naredna čitanja, obično ih sortirajući na osnovu teme teksta ispod kojeg se nalaze. Cilj ovog tipa widget-a je stimulisanje pažnje čitalaca. Na ovaj način, čitaoci mogu da otkriju još vrednog sadržaja koji odgovara njihovim interesovanjima.
Ono što naš content recommendation alat čini drugačijim je jedinstven biznis model, kao i način na koji se pokreće. Preciznije, naš content recommendation alat funkcioniše na osnovu dva kriterijuma:
- Loyalty CPI score (widget će prikazati one članke koji imaju natprosečnu Loyalty CPI vrednost, odnosno dokazano su učinkoviti za negovanje lojalne publike tog sajta)
- Relevantnost (uzima se u obzir kontekst, odnosno bliskost u pogledu teme)
Za razliku od većine content recommendation alata, naš ne preporučuje sadržaj koji je objavljen na drugim sajtovima, već samo onaj sadržaj koji je objavljen na samom sajtu. Na taj način, pomažemo medijima da podstaknu čitaoce na dalje istraživanje njihovog kvalitetnog sadržaja.
Na šta su ponosni u Content Insights-u?
Istraživanje uz pomoć algoritma Loyalty CPI, tj. prvi korak ka utvrđivanju faktora koji utiču na lojalnost čitalaca jednoj publikaciji. Budući da se u industriji onlajn medija lojalnost uglavnom svodi samo na učestalost poseta jednom sajtu, naš data science tim odlučio je da se posveti ispitivanju tzv. perzistencije u ponašanju čitalaca, odnosno procenjivanju šansi koliko će oni zadržati svoj oblik ponašanja u sagledivoj budućnosti. Razumevanje toga je ključ za razumevanje putovanja čitalaca od onih koji su novi posetioci jedne publikacije do razvitka navike čitanja te publikacije.
Data science u Srbiji kroz vizuru Content Insights-a
Sve veća količina podataka koja se obrađuje i nedostatak kadrova dovešće do toga da se algoritmi sve više automatizuju i da njihova primena postane dostupna i manje obučenim stručnjacima. Nauka o podacima je već godinama jedna od najperspektivnijih i najvažnijih IT oblasti, ali se stvari kod nas i dalje sporo razvijaju, naročito kada je reč o stvaranju novih stručnjaka. Zbog toga je najvažnija stvar za struku kod nas da se pokrene što više programa formalnog i neformalnog obrazovanja na temu data science.