Programski jezik R, koji često koriste naučnici, veoma je rasprostranjen u privatnom sektoru i njegovu primenu možete videti na asortimanima proizvoda u nekim najnaprednijim i najuspešnijim preduzećima. Moć R-a i njegova prilagođenost određenoj oblasti omogućava korisniku da kompleksnu analitiku izrazi jednostavno, brzo i sažeto.
Počev od osnove R-a i statističkog rezonovanja, u ovoj knjizi je detaljno razmatrana napredna prediktivna analitika i prikazan je način primene ovih tehnika na podatke u stvarnom svetu pomoću primera iz stvarnog sveta.
Ova knjiga počinje pregledom R-a i njegove sintakse, a obiluje rešenjima za probleme u vezi sa njegovim korišćenjem i vežbama. Upoznaćete osnove statistike koja je primenjena, a zatim ćete nadgraditi to znanje da biste mogli da obavljate sofisticiranu i moćnu analitiku. Rešićete poteškoće koje se odnose na obavljanje analize podataka u praksi i pronaći ćete rešenja za korišćenje „neurednih“ i velikih podataka i za izveštavanje o rezultatima i omogućavanje reproducibilnosti.
Knjiga je napisana tako da služi kao dragoceni izvor za analitičare podataka kroz mnoge faze njihove karijere.
Šta ćete naučiti iz ove knjige i za šta će vam koristiti stečeno znanje? - Upravljanje R okruženjem - Opis i vizuelizacija ponašanja podataka i veze između podataka - Bolje razumevanje statističkog rezonovanja i uzorkovanja - Korišćenje testova hipoteza za izvođenje zaključaka iz podataka - Učenje Bajesovih metoda za procenu parametara - Izvršavanje regresije radi procene kontinualnih promenljivih - Primena moćnih metoda klasifikacije za predviđanje kategorijskih podataka - Elegantno upravljanje nedostajućim podacima pomoću višestruke amputacije - Identifikovanje problematičnih tačaka podataka i upravljanje njima - Korišćenje paralelizacije i Rcppa za skaliranje analize na veće podatke - Primena najboljih tehnika za pojednostavljivanje posla i omogućavanje reproducibilnosti
Sadržaj 1: Osnove programskog jezika R 2: Oblik podataka 3: Opis veza 4: Verovatnoća 5: Korišćenje podataka za uzorkovanje i procenu 6: Testiranje hipoteza 7: Bajesove metode 8: Bootstrap 9: Predviđanje kontinualnih promenljivih 10: Predviđanje kategorijskih promenljivih 11: Predviđanje promena tokom vremena 12: Izvori podataka 13: Upravljanje nedostajućim podacima 14: Upravljanje neurednim podacima 15: Upravljanje velikim podacima 16: Korišćenje popularnih R paketa 17: Reproducibilnost i najbolje tehnike
Autor Tony Fischetti
Toni Fischetti je analitičar podataka na koledžu „Factual“ i svakodnevno koristi R da bi izgradio lične sisteme za rangiranje i preporuku. Diplomirao je kognitivnu nauku na institutu „Rensselaer Polytechnic“ - njegov diplomski rad je bio fokusiran na korišćenje statistike za proučavanje kratkoročne vizuelne memorije.
Uživa u pisanju softvera otvorenog koda i bloga na sajtu „onthelambda“, piše o sebi u trećem licu i deli svoje znanje, koristeći jednostavan pristupačan jezik i primere.
Takođe uživa u uobičajenim i uzbudljivim svakodnevnim aktivnostima, kao što su slušanje muzike, sviranje gitare i bubnjeva, dizanje tegova i pomaganje drugima.
Detaljni podaci o knjizi
Naslov: R analiza podataka, drugo izdanje Izdavač: Kompjuter biblioteka Strana: 564 (cb) Pismo: latinica Format: B5 Godina izdanja: 2018 ISBN: 978-86-7310-527-7