Besplatan kurs: Uvod u programski jezik R za Data Science
Data Science Serbia i Startit organizuju, po drugi put ove godine, besplatan kurs Uvod u programski jezik R za Data Science. Posle neverovatnog interesovanja za naš prvi kurs uvoda u R (oko 260 prijavljenih za 10 mesta), odlučili smo da ponovo pokrenemo ciklus od 11 sesija jednom nedeljno u Startit, tokom kojih će kvalifikovani i zainteresovani polaznici, studenti završnih godina studija i postidplomci, moći da savladaju osnove R, programskog jezika koji je i definitivno postao lingua franca savremene Data Science. Sadržajem, kurs će prvim delom biti fokusiran na upoznavanje sa radom u RStudio, najpoznatijem IDE za razvoj u R, zatim tipovima podataka i klasama objekata u programskom jeziku R, kontroli toka i funkcijama, dok ćemo kroz drugi deo kursa polaznike uvesti u modeliranje podataka pomoću generalnog linearnog modela (analiza varijanse i t-testovi, korelacije, jednostavni i multipla regresioni linearni model). Cilj kursa je da se tokom prvog dela savladaju osnovne programiranja u R, da bi tokom drugog dela kursa moglo da se savlada modeliranje podataka u R na primeru nekih tehnika iz generalnog linearnog modela. Eksploratorne tehnike će takođe biti pokrivene u drugom delu kursa, a vizuelizacijom ćemo se baviti postupno tokom celog kursa.
Slika: R simulacija sumi Poisson distribuiranih slučajnih promenljivih sa {base} R grafikom: ponašanje određenih distribucija verovatnoće koje opisuje centralna granična teorema.
Kurs drže Dr Goran S. Milovanović, Data Science Serbia, i Branko Kovač, Data Scientist, TradeCore, Data Science Serbia. Goran je Data Scientist i kognitivni psiholog sa velikim iskustvom u nastavi i primeni analitike podataka, koautor i urednik više knjiga i naučnih radova, i koristi programski jezik R od back-end interfejsa sa postgreSQL bazama, preko kognitivnog izračunavanja algoritmima poput LDA u oblasti distribucione semantike, do izgradnje RStudio Shiny web-aplikacija na front-endu (primere Goranove analitičke R aplikacije u produkciji možete videti ovde). Branko je jedan od osnivača Data Science Srbija i Data Scientist zaposlen u fintech startupu TradeCore. Svoje iskustvo u korišćenju programskog jezika R sticao je baveći se analitikom različitih finansijskih podataka iz javno dostupnih izvora. Na Elektrotehničkom fakultetu je završio osnovne studije iz oblasti softverskog inženjerstva, a trenutno se na master studijama bavi izučavanjem različitih metoda mašinskog učenja i neuronskih mreža.
Foto: Atmosfera sa prethodnog Uvoda u R za Data Science kursa
Nastavni materijali i program kursa su već testirani na prethodnom, takođe besplatnom Uvodu u R održanom u Startitu, kao i profesionalno, održavanjem kursa na engleskom jeziku za polaznike iz privatnog i akademskog sektora u inostranstvu. Microsoft Development Center Serbia preporučuje (na https://www.microsoft.com/serbia/mdcs/faq.aspx, pod sekcijom Preparing for Data Science test) ovaj kurs za pripremu kandidata za testove za svoje Data Science pozicije.
Slika: Vizuelizacija odnosa nekoliko grupa rizika usmerenim grafovima pomoću {igraph} paketa u programskom jeziku R.
Zbog vrednosti samog kursa i potpuno volonterskog učešća predavača, od polaznika kursa će biti zahtevani posvećenost i redovnost u nastavi. Interesi predavača iz organizacije Data Science Serbia su isključivo popularizacija programskog jezika R i izgradnja Data Science zajednice.
Uslovi za učešće na konkursu za polaznike:
- da su trenutno nezaposleni
- da su studenti završnih godina studija ili postdiplomci
- da imaju interesovanja u oblasti matematičkog modeliranja u oblastima svojih studija ili interesovanja
- da imaju sklonosti ka analitičkom mišljenju i matematičkoj formulaciji problema koje rešavaju
- da su ozbiljni u nameri da nauče programski jezik R i primenjuju ga u daljem radu
- da su u prilici da prisustvuju skoro baš svakom času koji se organizuje (nastava se održava ponedeljkom od 18h u prostorijama Starit centra, Savska 5, Beograd; tolerisaće se samo jedan izostanak tokom 10-11 nedelja koliko će kurs trajati)
- da imaju makar osnovno predznanje programiranja na ma kom programskom jeziku
- da imaju osnovno znanje engleskog jezika
- da mogu da odvoje 2 sata nedeljno za nastavu i 3-4 sata nedeljno za domaće zadatke i vežbe tokom svih 10-11 nedelja trajanja kursa
- da će uvažavati rad na času, predavače i druge polaznike
- da će kao zalog priložiti 5.000 dinara; zalog se vraća svima koji prisustvuju svim terminima i koji rade domaće zadatke; oni koji to ne ispune treba da znaju da će njihov zalog biti uplaćen u dobrotvorne svrhe posle završetka kursa
Dodatak: zalog je jedini način koji imamo da osiguramo primanje samo ozbiljnih polaznika. U slučaju da polaznik prekrši dogovor o redovnosti i posvećenosti, zalog neće biti vraćen, ali ni zadržan od strane naše organizacije; biće uplaćen Domu za decu i omladinu Moša Pijade. Sva prava i obaveze organizatora i polaznika se definišu ugovorom.
Termini
Kurs se održava svakog ponedeljka, sa početkom u 18h i trajanju od dva sata, u prostorijama Startit centra, Savska 5, 11000 Beograd. Izabrani kandidati će biti e-mailom obavešteni o početku rada. Prva sesija kursa Uvod u R za Data Science biće održana u ponedeljak, 7. novembra.
Prijava
Za učešće na kursu Uvod u programski jezik R za Data Science možete se prijaviti popunjavanjem online forme. Prijave su otvorene do 28. oktobra 2016.
Molimo vas da razumete da je broj polaznika ograničen na 15 maksimalno. Pored onih koji će konkurisati sada, biće uzete u obzir i najbolje prijave za prethodni kurs Uvod u R za Data Science na koje – zbog ograničenih kapaciteta kursa – nismo mogli da odgovorimo pozitivno.
Program rada
- 1. nedelja: Upoznavanje sa programskim jezikom R i RStudio razvojnim okruženjem
- 2. nedelja: Strukture podataka u R
- 3. nedelja. Kontrola toka i funkcije u R
- 4. nedelja: Funkcije za rad sa stringovima u R
- 5. nedelja: Priprema podataka u R (Data Wrangling)
- 6. nedelja: Eksploratorna analiza podataka u R (EDA)
- 7. nedelja: Funkcije verovatnoće i testiranje distribucija u R
- 8. nedelja: Korelacije u R
- 9. nedelja: Model jednostavne linearne regresije u R
- 10. nedelja: Model multipla linearne regresije u R
- 11. nedelja: Analiza varijanse i t-test u R