Data science od podstaw Analiza danych w Pythonie Wydanie II.pdf

(930 KB) Pobierz
Tytuł oryginału: Data Science from Scratch: First Principles with Python, 2nd Edition
Tłumaczenie: Wojciech Bombik, z wykorzystaniem fragmentów książki „Data science od podstaw.
Analiza danych w Pythonie” w przekładzie Konrada Matuka
ISBN: 978-83-283-6154-6
© 2020 Helion SA
Authorized Polish translation of the English edition of Data Science from Scratch, 2nd Edition ISBN
9781492041139 © 2019 Joel Grus.
This translation is published and sold by permission of O’Reilly Media, Inc., which owns
or controls all rights to publish and sell the same.
All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means,
electronic or mechanical, including photocopying, recording or by any information storage retrieval system,
without permission from the Publisher.
Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej
publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną,
fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje
naruszenie praw autorskich niniejszej publikacji.
Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich
właścicieli.
Autor oraz Helion SA dołożyli wszelkich starań, by zawarte w tej książce informacje były kompletne
i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane z tym
ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Helion SA nie ponoszą również żadnej
odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji zawartych w książce.
Helion SA
ul. Kościuszki 1c, 44-100 Gliwice
tel. 32 231 22 19, 32 230 98 63
e-mail:
helion@helion.pl
WWW:
http://helion.pl
(księgarnia internetowa, katalog książek)
Pliki z przykładami omawianymi w książce można znaleźć pod adresem:
ftp://ftp.helion.pl/przyklady/dascp2.zip
Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/dascp2
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.
Printed in Poland.
Kup książkę
Poleć książkę
Oceń książkę
Księgarnia internetowa
Lubię to! » Nasza społeczność
Spis treści
Przedmowa do drugiego wydania ............................................................................. 11
Przedmowa do pierwszego wydania .......................................................................... 14
1. Wprowadzenie .......................................................................................................... 17
Znaczenie danych
Czym jest analiza danych?
Hipotetyczna motywacja
Określanie najważniejszych węzłów
Analitycy, których możesz znać
Wynagrodzenie i doświadczenie
Płatne konta
Tematy interesujące użytkowników
Co dalej?
17
17
18
19
21
23
25
26
27
2. Błyskawiczny kurs Pythona ........................................................................................ 29
Zasady tworzenia kodu Pythona
Skąd wziąć interpreter Pythona?
Środowiska wirtualne
Formatowanie za pomocą białych znaków
Moduły
Polskie znaki diakrytyczne
Funkcje
Łańcuchy
Wyjątki
Listy
Krotki
Słowniki
defaultdict
29
30
30
31
32
33
33
34
35
35
36
37
38
3
Kup książkę
Poleć książkę
Counter
Zbiory
Przepływ sterowania
Wartości logiczne
Sortowanie
Składanie list
Testy automatyczne i instrukcja assert
Programowanie obiektowe
Obiekty iterowalne i generatory
Losowość
Wyrażenia regularne
Narzędzia funkcyjne
Funkcja zip i rozpakowywanie argumentów
Argumenty nazwane i nienazwane
Adnotacje typów
Jak pisać adnotacje typów
Witaj w firmie DataSciencester!
Dalsza eksploracja
39
39
40
41
42
42
43
43
45
46
47
48
48
49
50
52
53
53
3. Wizualizacja danych .................................................................................................. 55
Pakiet matplotlib
Wykres słupkowy
Wykresy liniowe
Wykresy punktowe
Dalsza eksploracja
55
57
60
60
63
4. Algebra liniowa ......................................................................................................... 65
Wektory
Macierze
Dalsza eksploracja
65
69
71
5. Statystyka ................................................................................................................. 73
Opis pojedynczego zbioru danych
Tendencje centralne
Dyspersja
Korelacja
Paradoks Simpsona
Inne pułapki związane z korelacją
Korelacja i przyczynowość
Dalsza eksploracja
73
74
76
78
80
81
81
82
4
Spis treści
Poleć książkę
Kup książkę
6. Prawdopodobieństwo ............................................................................................... 83
Zależność i niezależność
Prawdopodobieństwo warunkowe
Twierdzenie Bayesa
Zmienne losowe
Ciągły rozkład prawdopodobieństwa
Rozkład normalny
Centralne twierdzenie graniczne
Dalsza eksploracja
83
84
85
87
87
89
91
93
7. Hipotezy i wnioski ..................................................................................................... 95
Sprawdzanie hipotez
Przykład: rzut monetą
Wartości p
Przedziały ufności
Hakowanie wartości p
Przykład: przeprowadzanie testu A-B
Wnioskowanie bayesowskie
Dalsza eksploracja
95
95
98
99
100
101
102
105
8. Metoda gradientu prostego ......................................................................................107
Podstawy metody gradientu prostego
Szacowanie gradientu
Korzystanie z gradientu
Dobór właściwego rozmiaru kroku
Używanie metody gradientu do dopasowywania modeli
Metody gradientu prostego: stochastyczna i minibatch
Dalsza eksploracja
107
108
111
111
112
113
114
9. Uzyskiwanie danych .................................................................................................117
Strumienie stdin i stdout
Wczytywanie plików
Podstawowe zagadnienia dotyczące plików tekstowych
Pliki zawierające dane rozdzielone separatorem
Pobieranie danych ze stron internetowych
HTML i parsowanie
Przykład: wypowiedzi kongresmenów
Korzystanie z interfejsów programistycznych
Format JSON (i XML)
Korzystanie z interfejsu programistycznego bez uwierzytelniania
Poszukiwanie interfejsów programistycznych
117
119
119
120
122
122
124
126
126
127
128
Spis treści
Kup książkę
5
Poleć książkę
Zgłoś jeśli naruszono regulamin