Mojih top 5 data science preporuka – Velimir Bulatović
Velimir je osnivač organizacije LazyBrain i jedan od ambasadora Deeplearning.ai, tech background miksovan sa product developmentom i biznis analizom, tako da bi svoju strast i pasiju opisao kao product engineering.
Sa nama deli neke od resursa i preporuka koje smatra korisnim.
Think Stats
Na početku, Velimir preporučuje knjigu “Think Stats” autora Allen B. Downey koja će vam pomoći da podobnije razumete i uronite u svet verovatnoće i statistike, ali i da steknete osnovne veštine i znanja kada je u pitanju Python jezik.
https://greenteapress.com/thinkstats/
Algoritamska pismenost
Koliko je važno algoritamsko razmišljanje i kakvu ulogu ima u rešavanju i modelovanju kompleksnih softverskih rešenja, najbolje ćete videti kroz izvanredan kurs troje profesora sa MIT – a.
Osim analitičkog razmišljanja, teorije grafova i matematike, ovaj kurs će vam pomoći da razumete osnovne pojmove teorija mašisnkog učenja.
Introduction to Computational Thinking and Data Science
Deep Learning
Kada je u pitanju malo ozbiljnije zalaženje u ML, preporuka je da počnete lagano sa playlistom koja je nastala 2015. na Oxfordskom departmanu za računarske nauke: (link)
Nakon toga, možete se zabaviti malo ozbiljnijom literaturom koja se bavi teorijskim prikazom osnovnih ideja u mašinskom učenju i matematičkim izvodima koji transformišu te principe u praktične algoritme. (link)
I naravno, uvek preporuka, bez imalo razmišljanja, bilo koji od kurseva i/ili specijalizacija Andrew Ng – a , jednog od osnivača Coursera i Deeplearning.ai platformi.
https://www.deeplearning.ai/programs/
Istraživački radovi
Iako niste na doktorskim studijama, research paper-i su jedna od stvari sa kojom idete na spavanja i sa kojom se budite, jer profesija jednog ML inženjera nema smisla bez dobre prakse, edge case – ova i dugih, uvrnutih rečenica koje zahtevaju ponovna iščitavanja.
Stoga, preporučujem dva paper-a koja su meni bila interesantna i zanimljiva.
Prvi se bavi analizom i predikcijom popularnosti mimova na Redditu (link), a drugi analizom mentalnog zdravlja na osnovu stope samoubistava u periodu od 1985. do 2015. godine.(link).
Ukoliko ste, pak, na doktorskim studijama i dalje, onda vama ne preporučujemo ništa, imate dovoljno svojih briga.
Izvori podataka (i resursi za učenje)
Od resursa dostupnih podataka i literature, tu svakako možete pogledati u kakvoj su vezi Bitcoin i twitter i kako je ta veza evoluirala kroz vreme (link), ali i online biblioteku (link), gde možete pronaći veliki broj knjiga dostupnih za slobodno preuzimanje.
Takođe, ukoliko se igrate sa procesiranjem videa i slika (u narodu poznati “Computer Vision”), pa dalje NLP – om i zvukom, onda možete pogledati i bogat Facebook – ov dataset koji sadrži preko 45k video snimaka (link).
* AI Epiphany
Na kraju, iskrena preporuka da pogledate Github repo, ali i Youtube kanal AI Epiphany, tamo možete pronaći vrlo korisne materijale za učenje, primere implementacija nekih od state-of-the-art paper-a, ali se i zabaviti uz Aleksin neponovljiv smisao za humor.