![]() |
![]() |
Twoje konto | Zarejestruj | Schowek | Kontakt | Pomoc |
![]() Język R i analiza danych w praktyce. Wydanie II
Analiza danych albo nauka o danych jest interdyscyplinarną dziedziną, dzięki której hipotezy i dane przekształca się w zrozumiałe przewidywania. Predykcyjna analiza danych przynosi wymierne korzyści w wielu dziedzinach, od polityki począwszy, a na udzielaniu kredytów skończywszy. Osobą odpowiedzialną za tę magię jest analityk danych - człowiek, który zbiera i przygotowuje dane, wybiera technikę modelowania, pisze kod, weryfikuje wyniki swojej pracy, wreszcie komunikuje je interesariuszom. Jak widać, profesja analityka danych jest wyjątkowo atrakcyjna i wyjątkowo wymagająca. Aby określić umiejętności praktyczne wymagane w zawodzie analityka danych, najlepiej prześledzić realizacje konkretnych projektów z wykorzystaniem rzeczywistych danych. Ta książka jest samouczkiem prezentującym praktyczne aspekty dziesiątek technik, które wykorzystują profesjonalni analitycy danych. Główny nacisk autorzy położyli na zadania: ich zaplanowanie, przygotowanie, realizację i prezentację wyników. Dzięki praktycznemu podejściu z tej pozycji skorzystają zarówno analitycy biznesowi, jak i badacze danych. Pokazano tu, w jakich przypadkach i w jaki sposób należy stosować techniki statystyczne oraz metody uczenia maszynowego. W każdym rozdziale omówiono nowe narzędzia w kontekście rzeczywistych, praktycznych projektów. W rezultacie powstał potężny zbiór przydatnych ćwiczeń napisanych w języku R, opatrzonych wartościowymi wskazówkami, komentarzami i podpowiedziami. W książce między innymi:
R: jesteś gotów na właściwe wyniki analizy danych?Przedmowa 13
Wstęp 15 Podziękowania 17 Informacje o książce 19 Informacje o autorach 27 Informacje o autorach przedmowy 29 CZĘŚĆ I. WPROWADZENIE DO ANALIZY DANYCH 31 1. Proces analizy danych 33
2. Wprowadzenie do języka R i danych 51
3. Eksploracja danych 85
4. Zarządzanie danymi 121
5. Inżynieria i kształtowanie danych 147
CZĘŚĆ II. METODY MODELOWANIA 195 6. Wybór i ocena modeli 197
7. Regresja liniowa i logistyczna 249
8. Zaawansowane przygotowywanie danych 309
9. Metody nienadzorowane 347
10. Zaawansowane metody uczenia maszynowego 391
CZĘŚĆ III. PRACA W PRAWDZIWYM ŚWIECIE 441 11. Dokumentowanie i wdrażanie 443
12. Tworzenie użytecznych prezentacji 477
Dodatek A. Korzystanie z R i innych narzędzi 497 Dodatek B. Ważne pojęcia z dziedziny statystyki 523 Dodatek C. Bibliografia 559 |
|