Michael Freeman, Joel Ross data science. programowanie, analiza i wizualizacja danych z wykorzystaniem języka helion.pdf

(36694 KB) Pobierz
Spis treści
Przedmowa ............................................................................. 11
Wprowadzenie ........................................................................ 13
O autorach ............................................................................. 19
CZĘŚĆ I Wprowadzenie ....................................................... 21
Rozdział 1
Przygotowywanie komputera ................................................... 23
1.1. Przygotowywanie narzędzi używanych w wierszu poleceń .................
1.1.1. Wiersz poleceń w systemie macOS .....................................
1.1.2. Wiersz poleceń w systemie Windows ...................................
1.1.3. Wiersz poleceń w systemie Linux ........................................
1.2. Instalowanie systemu git .............................................................
1.3. Tworzenie konta w serwisie GitHub ...............................................
1.4. Wybieranie edytora tekstu ............................................................
1.4.1. Atom ................................................................................
1.4.2. Visual Studio Code ............................................................
1.4.3. Sublime Text .....................................................................
1.5. Pobieranie języka R .....................................................................
1.6. Pobieranie
środowiska
RStudio ....................................................
24
24
25
25
25
26
26
26
27
27
28
28
31
32
33
35
35
37
37
39
40
41
42
Rozdział 2
Używanie wiersza poleceń ....................................................... 31
2.1. Uruchamianie wiersza poleceń .....................................................
2.2. Poruszanie się w systemie plików .................................................
2.2.1. Przechodzenie do innego katalogu ......................................
2.2.2. Wyświetlanie listy plików ....................................................
2.2.3.
Ścieżki
..............................................................................
2.3. Zarządzanie plikami .....................................................................
2.3.1. Uczenie się nowych instrukcji .............................................
2.3.2. Symbole wieloznaczne .......................................................
2.4. Radzenie sobie z błędami ............................................................
2.5. Przekierowywanie danych wyjściowych ...........................................
2.6. Polecenia związane z siecią ..........................................................
Kup książkę
Poleć książkę
6
Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R
CZĘŚĆ II Zarządzanie projektami .......................................... 45
Rozdział 3
Kontrola wersji z użyciem systemu git i serwisu GitHub ........... 47
3.1. Czym jest git? .............................................................................
3.1.1. Podstawowe zagadnienia związane z systemem git ..............
3.1.2. Czym jest GitHub? .............................................................
3.2. Konfigurowanie narzędzi i tworzenie projektu .................................
3.2.1. Tworzenie repozytorium ......................................................
3.2.2. Sprawdzanie stanu ............................................................
3.3.
Śledzenie
zmian w projekcie .........................................................
3.3.1. Dodawanie plików ..............................................................
3.3.2. Zatwierdzanie ....................................................................
3.3.3. Proces używania systemu git ..............................................
3.4. Zapisywanie projektów w witrynie GitHub .......................................
3.4.1. Forki i klonowanie ..............................................................
3.4.2. Wysyłanie i pobieranie .......................................................
3.5. Dostęp do historii projektu ...........................................................
3.5.1. Historia rewizji ...................................................................
3.5.2. Powrót do starszych wersji .................................................
3.6. Ignorowanie plików w projekcie .....................................................
47
48
49
50
51
51
52
53
54
55
56
57
59
60
60
61
62
65
66
66
67
67
68
68
Rozdział 4
Tworzenie dokumentacji za pomocą języka Markdown ............. 65
4.1. Pisanie kodu w języku Markdown ..................................................
4.1.1. Formatowanie tekstu .........................................................
4.1.2. Bloki tekstu ......................................................................
4.1.3. Hiperłącza ........................................................................
4.1.4. Rysunki ............................................................................
4.1.5. Tabele ..............................................................................
4.2. Wyświetlanie dokumentów w języku Markdown ..............................
CZĘŚĆ III Podstawowe umiejętności z zakresu języka R ......... 71
Rozdział 5
Wprowadzenie do języka R ..................................................... 73
5.1. Programowanie z użyciem języka R ...............................................
5.2. Uruchamianie kodu w języku R .....................................................
5.2.1. Używanie
środowiska
RStudio ............................................
5.2.2. Używanie języka R w wierszu poleceń ..................................
5.3. Dodawanie komentarzy ................................................................
5.4. Definiowanie zmiennych ...............................................................
5.4.1. Podstawowe typy danych ....................................................
5.5. Szukanie pomocy ........................................................................
5.5.1. Nauka uczenia się języka R ................................................
73
74
74
76
78
78
80
83
84
89
90
91
92
Rozdział 6
Funkcje ................................................................................. 89
6.1. Czym jest funkcja? ......................................................................
6.1.1. Składnia funkcji w języku R .................................................
6.2. Wbudowane funkcje języka R ........................................................
6.2.1. Argumenty nazwane ...........................................................
Kup książkę
Poleć książkę
Spis treści
6.3. Wczytywanie funkcji .....................................................................
6.4. Pisanie funkcji .............................................................................
6.4.1. Debugowanie funkcji ..........................................................
6.5. Instrukcje warunkowe ..................................................................
93
95
97
98
7
Rozdział 7
Wektory ............................................................................... 101
7.1. Czym jest wektor? .....................................................................
7.1.1. Tworzenie wektorów .........................................................
7.2. Operacje wektorowe ..................................................................
7.2.1. Ponowne używanie elementów ..........................................
7.2.2. Prawie wszystko jest wektorem .........................................
7.2.3. Funkcje wektorowe ..........................................................
7.3. Indeksy w wektorach .................................................................
7.3.1. Listy indeksów ................................................................
7.4. Filtrowanie wektorów .................................................................
7.5. Modyfikowanie wektorów ............................................................
101
101
102
104
105
105
107
108
109
110
113
114
115
117
118
119
Rozdział 8
Listy ..................................................................................... 113
8.1. Czym jest lista? .........................................................................
8.2. Tworzenie list ............................................................................
8.3. Dostęp do elementów listy .........................................................
8.4. Modyfikowanie list .....................................................................
8.4.1. Pojedyncze i podwójne nawiasy kwadratowe ......................
8.5. Stosowanie funkcji do list za pomocą wywołania lapply() ...............
CZĘŚĆ IV Przekształcanie danych ........................................ 121
Rozdział 9
Jak zrozumieć dane? ............................................................. 123
9.1. Proces generowania danych .......................................................
9.2. Wyszukiwanie danych ................................................................
9.3. Rodzaje danych .........................................................................
9.3.1. Skale pomiarowe .............................................................
9.3.2. Struktury danych ..............................................................
9.4. Interpretowanie danych ..............................................................
9.4.1. Zdobywanie wiedzy w danej dziedzinie ...............................
9.4.2. Jak zrozumieć schematy danych? ......................................
9.5. Odpowiadanie na pytania na podstawie danych ............................
10.1. Czym jest ramka danych? .........................................................
10.2. Praca z ramkami danych ..........................................................
10.2.1. Tworzenie ramek danych ..............................................
10.2.2. Opisywanie struktury ramek danych ..............................
10.2.3. Dostęp do ramek danych .............................................
10.3. Praca z danymi CSV .................................................................
10.3.1. Katalog roboczy ...........................................................
10.3.2. Zmienne w postaci faktorów .........................................
123
124
126
126
127
129
129
131
133
135
136
136
137
138
139
140
142
Rozdział 10 Ramki danych ...................................................................... 135
Kup książkę
Poleć książkę
8
Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R
Rozdział 11 Operowanie danymi za pomocą pakietu dplyr ........................ 145
11.1. Gramatyka operowania danymi .................................................
11.2. Podstawowe funkcje pakietu dplyr ............................................
11.2.1. Pobieranie (funkcja select()) .........................................
11.2.2. Filtrowanie (funkcja filter()) ...........................................
11.2.3. Dodawanie kolumn (funkcja mutate()) ...........................
11.2.4. Sortowanie danych (funkcja arrange()) ...........................
11.2.5. Tworzenie podsumowań (funkcja summarize()) ...............
11.3. Wykonywanie operacji sekwencyjnych .......................................
11.3.1. Operator potoku ..........................................................
11.4. Analizowanie ramek danych z wykorzystaniem grupowania ..........
11.5. Złączanie ramek danych ...........................................................
11.6. Pakiet dplyr w praktyce — analizowanie danych na temat lotów ..
12.1. Czym jest porządkowanie danych? ............................................
12.2. Od kolumn do wierszy — gather() .............................................
12.3. Z wierszy na kolumny — spread() .............................................
12.4. Pakiet tidyr w praktyce — eksplorowanie statystyk
na temat edukacji ...................................................................
13.1. Przegląd relacyjnych baz danych ...............................................
13.1.1. Czym jest relacyjna baza danych? .................................
13.1.2. Tworzenie relacyjnej bazy danych ..................................
13.2. Wstęp do języka SQL ...............................................................
13.3. Dostęp do bazy danych w języku R ............................................
14.1. Czym jest internetowy interfejs API? ..........................................
14.2.
Żądania
REST .........................................................................
14.2.1. Identyfikatory URI ........................................................
14.2.2. Operacje (czasowniki) z protokołu HTTP .........................
14.3. Dostęp do internetowych interfejsów API w R .............................
14.4. Przetwarzanie danych w formacie JSON .....................................
14.4.1. Przetwarzanie danych w formacie JSON .........................
14.4.2. Spłaszczanie danych ...................................................
14.5. Interfejsy API w praktyce — znajdowanie kubańskiego
jedzenia w Seattle ...................................................................
145
146
147
149
150
151
152
153
154
155
157
162
169
171
172
174
181
182
184
185
189
193
194
194
201
201
203
205
207
209
Rozdział 12 Porządkowanie danych za pomocą pakietu tidyr .................... 169
Rozdział 13 Dostęp do bazy danych ........................................................ 181
Rozdział 14 Używanie internetowych interfejsów API ............................... 193
CZĘŚĆ V Wizualizacje danych ............................................ 215
Rozdział 15 Projektowanie wizualizacji danych ........................................ 217
15.1. Cel wizualizacji ........................................................................
15.2. Wybieranie układu graficznego ..................................................
15.2.1. Wizualizowanie jednej zmiennej ....................................
15.2.2. Wizualizowanie wielu zmiennych ...................................
15.2.3. Wizualizowanie danych hierarchicznych .........................
217
219
220
223
227
Kup książkę
Poleć książkę
Zgłoś jeśli naruszono regulamin