BelgradeR okupljanje – Metode distribucione semantike u R
Novo BelgradeR okupljanje je zakazano za 30. novembar od 18h, na dobro poznatoj adresi – Startit Centar, Savska br. 5.
Goran S. Milovanović iz Data Science Srbija će predstaviti i diskutovati metode distribucione semantike za text-mining u R. Prvi deo priče će biti fokusiran na klase i funkcije u R koje podržavaju preprocesiranje teksta za metode distribucione semantike, većim delom u blizini {tm} paketa koji je postao R standard u ovoj oblasti. Drugi deo priče i diskusije će se biti posvećen modeliranju Latentnom Dirišle alokacijom (LDA) iz R; glavni primer će koristiti popularni topicmodels} paket; dotaćićemo se i proučavanja i vizuelizacije modela topika (putem raznih R paketa). Takođemo ćemo predstaviti i metode prepoznavanja entiteta iz Apache OpenNLP biblioteke, koji su u R dostupni kroz {openNLP} paket. Ako nam vreme dozvoli, razgovaraćemo o razlikama između varijacionog EM algoritma i Gibsovog semplera u oceni LDA modela iz matrice termina i dokumenata, te uporediti ono čime raspolažemo u R sa rešenjima dostupnim u Python za rešenje problema ocene ovog modela.
Prijave su dostupne na zvaničnoj stranici dogadjaja.