Zobacz też: ⚠⚠⚠
Autor: Marek Gągolewski
Wydawca: Wydawnictwo Naukowe PWN
Liczba stron: 550
Wydanie: 2 poszerzone
ISBN: 978-83-01-18939-6
Treści zawarte w niniejszym repozytorium udostępnione są zgodnie z zasadami otwartej licencji BSD-2-clause i stanowią materiał uzupełniający do książki.
Otwarte i wolnodostępne środowisko R zyskało w ostatnich latach ogromną popularność. Język R jest jednym z podstawowych narzędzi w warsztacie wielu analityków danych, statystyków, data scientists, badaczy opinii i rynku, specjalistów business intelligence czy naukowców.
Większość publikacji dostępnych na polskim i zagranicznym rynku wydawniczym skupia się na omawianiu sposobów wykorzystania środowiska R w różnych zastosowaniach praktycznych, m.in. w ekonomii, medycynie, bioinformatyce, psychologii, socjologii oraz naukach technicznych. Objaśnia zatem sposób korzystania z szablonowych rozwiązań na zasadzie „kucharskich przepisów”. Ta oto książka stawia sobie jednak za cel wsparcie Czytelnika w jego drodze ku programistycznej samodzielności – aby mógł wyjść poza gotowe schematy i śmiało mierzyć się z nowymi wyzwaniami, przed jakimi stawia nas tzw. era informacji.
Książka skupia się na dogłębnym wyjaśnieniu zasad funkcjonowania środowiska R. Nie można jej jednak nazwać po prostu kursem programowania, a to dlatego, że R jest ściśle związany z bogatymi obszarami swoich zastosowań. Czytelnik dowie się więc, w jaki sposób przeprowadzać w R obliczenia symulacyjne i numeryczne, jak implementować algorytmy przetwarzania danych, pobierać, tworzyć i przygotowywać zbiory danych do analizy, automatyzować bardzo żmudne – gdyby je wykonywać ręcznie – zadania czy też tworzyć raporty, tabele i wykresy.
Pierwsze wydanie Programowania w języku R zostało przygotowane w 2013 r. W ukazującym się po 3 latach drugim wydaniu zaszedł szereg istotnych zmian --- wszystkie partie tekstu zostały zrewidowane, a wiele z nich nawet zostało przepisanych od nowa. Do najbardziej zauważalnych różnic możemy zaliczyć:
-
uproszczenie materiału przedstawianego na początku każdego rozdziału --- trudniejsze partie zostały przesunięte zgodnie z duchem „od ogółu do szczegółu";
-
dodanie kilkuset ćwiczeń (wraz z rozwiązaniami) do tekstu głównego;
-
zamieszczenie większej liczby przykładów z analizy danych (opis implementacji wielu ważnych metod maszynowego uczenia się, więcej uwagi poświęconej ramkom danych);
-
nowy rozdział na temat integracji C++ z R (coraz więcej pakietów jest tworzona przy użyciu
Rcpp
, co bardzo pozytywnie wpłynęło w ostatnich latach na szeroko pojętą jakość tego rodzaju dodatków); -
omówienie pakietu
stringi
w rozdziale na temat przetwarzania napisów; -
przesunięcie rozdziału nt. pętli jak najdalej, jak to było możliwe;
-
opis sposobów dostępu do baz danych SQL, przetwarzania plików JSON i XML oraz technik wydobywania informacji ze stron internetowych (ang. web scraping);
-
złączenie dwóch rozdziałów na temat generowania grafiki w jeden;
-
opis języka Markdown w rozdz. na temat generowania dynamicznych raportów;
-
bardziej dokładne omówienie sposobów tworzenia pakietów i poprawy szeroko pojętej jakości kodu;
-
bardziej przystępne omówienie mechanizmów niestandardowej ewaluacji i jej znaczenia.