NoSQL_NewSQL_i_BigData_Bazy_danych_nastepnej_generacji_nosqln.pdf

(2169 KB) Pobierz
Tytuł oryginału: Next Generation Databases: NoSQL and Big Data
Tłumaczenie: Piotr Pilch
ISBN: 978-83-283-4751-9
Original edition copyright © 2015 by Guy Harrison.
All rights reserved.
Polish edition copyright © 2018 by HELION SA.
All rights reserved.
All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means,
electronic or mechanical, including photocopying, recording or by any information storage retrieval system,
without permission from the Publisher.
Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej
publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną,
fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje
naruszenie praw autorskich niniejszej publikacji.
Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich
właścicieli.
Autor oraz Helion SA dołożyli wszelkich starań, by zawarte w tej książce informacje były kompletne
i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane z tym
ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Helion SA nie ponoszą również
żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji zawartych w książce.
Helion SA
ul. Kościuszki 1c, 44-100 Gliwice
tel. 32 231 22 19, 32 230 98 63
e-mail:
helion@helion.pl
WWW:
http://helion.pl
(księgarnia internetowa, katalog książek)
Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/nosqln
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.
Printed in Poland.
Kup książkę
Poleć książkę
Oceń książkę
Księgarnia internetowa
Lubię to! » Nasza społeczność
Spis treści
O autorze ........................................................................................................ 11
O recenzencie merytorycznym ......................................................................... 13
Podziękowania ................................................................................................ 15
Część I
Bazy danych następnej generacji ..................................................... 17
Wczesne systemy baz danych ................................................................................................... 19
Pierwsza rewolucja związana z bazami danych ...................................................................... 21
Druga rewolucja związana z bazami danych .......................................................................... 23
Teoria modelu relacyjnego ................................................................................................. 23
Modele transakcji ................................................................................................................. 25
Pierwsze relacyjne bazy danych ......................................................................................... 25
Wojny baz danych! .............................................................................................................. 26
Model przetwarzania klient-serwer ................................................................................... 26
Programowanie obiektowe i system OODBMS .............................................................. 27
Okres stabilizacji relacyjnych baz danych ........................................................................ 29
Trzecia rewolucja związana z bazami danych ........................................................................ 29
Google i Hadoop .................................................................................................................. 29
Reszta witryn internetowych .............................................................................................. 30
Chmura obliczeniowa ......................................................................................................... 30
Bazy danych dokumentów ................................................................................................. 31
NewSQL ................................................................................................................................ 32
Eksplozja nierelacyjnych baz danych ................................................................................ 32
Podsumowanie: jeden rozmiar nie pasuje wszystkim ........................................................... 33
Źródła ........................................................................................................................................... 34
Rozdział 1. Trzy rewolucje związane z bazami danych ...................................................... 19
Kup książkę
Poleć książkę
SPIS TREŚCI
Rozdział 2. Google, Big Data i Hadoop .............................................................................. 35
Rewolucja związana z koncepcją Big Data .............................................................................. 35
Chmura, urządzenia przenośne, serwisy społecznościowe i Big Data ......................... 36
Google: pionier koncepcji Big Data ......................................................................................... 37
Sprzęt używany przez firmę Google .................................................................................. 38
Stos oprogramowania firmy Google ................................................................................. 38
Dodatkowe informacje o modelu MapReduce ................................................................ 40
Hadoop: stos open source firmy Google ................................................................................. 42
Początki technologii Hadoop ............................................................................................. 42
Siła technologii Hadoop ...................................................................................................... 43
Architektura technologii Hadoop ..................................................................................... 43
HBase ..................................................................................................................................... 46
Hive ........................................................................................................................................ 46
Pig ........................................................................................................................................... 49
Ekosystem Hadoop .............................................................................................................. 49
Podsumowanie ............................................................................................................................ 50
Źródła ........................................................................................................................................... 51
Rozdział 3. Sharding, Amazon i narodziny systemu NoSQL ............................................... 53
Skalowanie standardu Web 2.0 ................................................................................................. 53
Historia triumfu standardu Web 2.0 ................................................................................. 54
Rozwiązanie open source .................................................................................................... 55
Sharding ................................................................................................................................ 55
Fatalny koniec spowodowany przez tysiąc segmentów .................................................. 57
Twierdzenie CAP ................................................................................................................. 58
Spójność ostateczna ............................................................................................................. 58
System Dynamo firmy Amazon ............................................................................................... 59
Mieszanie spójne .................................................................................................................. 62
Spójność umożliwiająca dostosowanie ............................................................................. 62
System Dynamo i rodzina magazynów klucz-wartość ................................................... 63
Podsumowanie ............................................................................................................................ 65
Źródła ........................................................................................................................................... 65
Rozdział 4. Bazy danych dokumentów .............................................................................. 67
Format XML i bazy danych XML ............................................................................................ 68
Narzędzia i standardy związane z formatem XML ......................................................... 68
Bazy danych XML ................................................................................................................ 69
Obsługa danych XML w systemach relacyjnych ............................................................. 69
Bazy danych dokumentów JSON ............................................................................................. 70
JSON i AJAX ......................................................................................................................... 71
Bazy danych dokumentów JSON ...................................................................................... 71
Modele danych w bazach danych dokumentów .............................................................. 73
Pierwsze bazy danych dokumentów JSON ...................................................................... 74
MemBase i Couchbase ........................................................................................................ 75
MongoDB .............................................................................................................................. 75
Format JSON, wszędzie format JSON .............................................................................. 76
Podsumowanie ............................................................................................................................ 77
6
Kup książkę
Poleć książkę
SPIS TREŚCI
Rozdział 5. Tabele nie są przyjazne: grafowe bazy danych ............................................... 79
Czym jest graf? ............................................................................................................................ 79
Wzorce systemu RDBMS związane z grafami ........................................................................ 81
RDF i SPARQL ........................................................................................................................... 82
Grafy właściwości i Neo4j ......................................................................................................... 83
Gremlin ........................................................................................................................................ 84
Wewnętrzne szczegóły baz danych grafów ............................................................................. 86
Silniki obliczeniowe grafów ...................................................................................................... 87
Podsumowanie ............................................................................................................................ 88
Rozdział 6. Kolumnowe bazy danych ................................................................................ 89
Schematy hurtowni danych ...................................................................................................... 89
Alternatywa kolumnowa ........................................................................................................... 91
Kompresja kolumnowa ....................................................................................................... 91
Konsekwencje zapisu kolumnowego ................................................................................ 93
Sybase IQ, C-Store i Vertica ...................................................................................................... 94
Architektury kolumnowych baz danych ................................................................................. 94
Projekcje ................................................................................................................................ 96
Technologia kolumnowa w innych bazach danych ........................................................ 97
Podsumowanie ............................................................................................................................ 98
Źródła ........................................................................................................................................... 98
Rozdział 7. Koniec dysku? Pamięciowe bazy danych i bazy oparte na dyskach SSD ......... 99
Koniec dysku? ............................................................................................................................. 99
Dysk SSD ............................................................................................................................. 100
Ekonomia dysku ................................................................................................................. 101
Bazy danych oparte na dyskach SSD ............................................................................... 102
Pamięciowe bazy danych ......................................................................................................... 103
TimesTen ............................................................................................................................ 104
Redis ..................................................................................................................................... 105
SAP HANA ......................................................................................................................... 107
VoltDB ................................................................................................................................. 109
„Pamięciowa” baza danych Oracle 12c ........................................................................... 111
Stos Berkeley Analytics Data Stack i Spark ........................................................................... 112
Architektura środowiska Spark ........................................................................................ 113
Podsumowanie .......................................................................................................................... 115
Źródła ......................................................................................................................................... 115
Część II
Ze wszystkimi szczegółami ............................................................ 117
Rozproszone relacyjne bazy danych ...................................................................................... 120
Replikacja ............................................................................................................................ 120
Współużytkowany dysk i brak współużytkowania ....................................................... 120
Nierelacyjne rozproszone bazy danych ................................................................................. 124
Rozdział 8. Wzorce rozproszonych baz danych ................................................................ 119
7
Kup książkę
Poleć książkę
Zgłoś jeśli naruszono regulamin