-
Notifications
You must be signed in to change notification settings - Fork 27
/
schedule.xml
594 lines (554 loc) · 22.5 KB
/
schedule.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE article [
]>
<article xmlns="http://docbook.org/ns/docbook" version="5.0"
xmlns:xi="http://www.w3.org/2001/XInclude"
xmlns:xlink="http://www.w3.org/1999/xlink"
xml:id="nosql-schedule">
<title>Методы использования СУБД в интернет-приложениях,
Техносфера Mail.Ru, 2014 г.</title>
<para>
Курс лекций раздёлён на 4 части, в конце каждой части
проводится колоквиум.
</para>
<section>
<title>Структуры данных и алгоритмы для двухуровневой памяти</title>
<orderedlist>
<listitem>
<para>
Многообразие решений для хранения данных. Модели данных
классических и NoSQL систем. Модели консистентности.
Семантика и допустимость овердрафта в интернет-приложениях.
</para>
<para>
Достоинства и недостатки реляционной модели для
работы с данными в Интернет.
Модель данных ключ-значение. Модель BigTable. Различия между
документом и объектом. Понятие агрегата хранения.
Управление схемой данных. Компромисс между
консистентностью и производительностью. Конкурентный доступ
к данным в клиент-серверной и полностью распределённой
архитектуре. Пример графовых задач в РСУБД.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Codd, E.F.
</personname>
</author>
<title>
A Relational Model of Data for Large Shared Data Banks
</title>
</biblioentry>
<biblioentry>
<author><personname>
Date, C. J.; Darwen, Hugh
</personname>
</author>
<title>
Foundation for future database systems: the third
manifesto: a detailed study of the impact of type
theory on the relational model of data, including
a comprehensive model of type inheritance.
</title>
</biblioentry>
<biblioentry>
<author><personname>
Pramod J. Sadalage, Martin Fowler
</personname></author>
<title>
NoSQL distilled
</title>
</biblioentry>
<biblioentry>
<author><personname>
Michael Stonebraker, Samuel Madden, Daniel J.
Abadi, Stavros Harizopoulos, Nabil Hachem, Pat
Helland
</personname></author>
<title>
The End of an Architectural Era (It’s Time for a
Complete Rewrite)
</title>
</biblioentry>
<biblioentry>
<author><personname>Christof Strauch</personname></author>
<title>NoSQL Databases</title>
</biblioentry>
<biblioentry>
<author><personname>
Mikael Ronström
</personname></author>
<title>
Design and Modelling of a Parallel Data Server for
Telecom Applications
</title>
</biblioentry>
<biblioentry>
<author><personname>
Fay Chang, Jeffrey Dean, Sanjay Ghemawat,
Wilson C. Hsieh, Deborah A. Wallach Mike
Burrows, Tushar Chandra, Andrew Fikes, Robert
E. Gruber
</personname></author>
<title>
Bigtable: A Distributed Storage System for Structured Data
</title>
</biblioentry>
<biblioentry>
<author><personname>
Joe Celko
</personname></author>
<title>
Trees and hierarchies in SQL
</title>
</biblioentry>
<biblioentry>
<author><personname>
Mike Buerli
</personname></author>
<title>
The Current State of Graph Databases
</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Классические алгоритмы организации даных для двухуровневой
памяти.
</para>
<para>
B-деревья. Инвертированные списки. Многопроходная сортировка
слиянием. Стоимостная модель DAM.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>Alok Aggarwal, Jeffrey Scott Vitter</personname></author>
<title>The input/output complexity of sorting and related problems</title>
</biblioentry>
<biblioentry>
<author><personname>Douglas Comer</personname></author>
<title>The Ubiquitous B-tree</title>
</biblioentry>
<biblioentry>
<author><personname>Michael A. Bender, Bradley C. Kuszmaul</personname></author>
<title>Data Structures and Algorithms for Big Databases</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Современные специализированные алгоритмы хранения данных
в двухуровневой памяти.
</para>
<para>
Понятие cache-oblivious алгоритма. Базовые
cache-oblivious алгоритмы. Понятие write amplification.
Фрактальные деревья.
</para>
<formalpara><title>Домашнее задание:</title>
<para>Реализовать библиотеку для хранения данных на диске.</para>
</formalpara>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>Harald Prokop</personname></author>
<title>Cache-Oblivious Algorithms</title>
</biblioentry>
<biblioentry>
<author><personname>Michael A. Bender Martin Farach-Colton Jeremy T. Fineman</personname></author>
<title>Cache-Oblivious Streaming B-trees </title>
</biblioentry>
<biblioentry>
<author><personname>Burton H. Bloom</personname></author>
<title>Space/time trade-offs in hash coding with allowable errors
</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Современные специализированные алгоритмы хранения данных
в двухуровневой памяти (часть 2).
</para>
<para>
LSM деревья. Блум-фильтры. Двухуровневые деревья.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>Justin Sheehy, David Smith</personname></author>
<title>Bitcask A Log-Structured Hash Table for Fast Key/Value Data</title>
</biblioentry>
<biblioentry>
<author><personname>Patrick O'Neil , Edward Cheng, Dieter Gawlick, Elizabeth O'Neil</personname></author>
<title>The Log-Structured Merge-Tree (LSM-Tree)</title>
</biblioentry>
<biblioentry>
<author><personname>Burton H. Bloom</personname></author>
<title>Space/time trade-offs in hash coding with allowable errors
</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Кэширование как механизм повышения эффективности системы.
</para>
<para>
Понятие online алгоритмов. Кэширование. Алгоритмы FIFO, LRU.
Алгоритм LFD. Проблема конистентности кэша. Алгоритм
RCU. Протокол MESI. Проблема холодного старта.
</para>
<formalpara><title>Домашнее задание:</title>
<para>
Реализовать LRU/midpoint insertion cache для библиотеки
хранения данных на диске.
</para>
</formalpara>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Amos Fiat, Richard M. Brp,Michael Luby, Lyle A. McGeoch, Daniel D. Sleator, Neal E. Young
</personname></author>
<title>
Competitive Paging Algorithms
</title>
</biblioentry>
<biblioentry>
<author><personname>
Erik Demaine
</personname></author>
<title>
Online algorithms for paging (MIT OCW Lectures on Computer Science)
</title>
</biblioentry>
</bibliolist>
</listitem>
</orderedlist>
</section>
<section>
<title>Основы устройства СУБД</title>
<orderedlist>
<listitem>
<para>
Принципиальная схема СУБД.
</para>
<para>
Сетевая подсистема. Разбор и оптимизация запросов.
План выполнения запроса. Управление страницами.
Управление блокировками. Журнал.
</para>
<formalpara><title>Домашнее задание:</title>
<para>
Реализация конкурентного доступа к данным
с использованием библиотеки хранения данных
на диске.
</para>
</formalpara>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Heikki Tuuri
</personname></author>
<title>InnoDB Internals, presentation</title>
</biblioentry>
<biblioentry>
<author><personname>
Philip A. Bernstein, Eric Newcomer
</personname></author>
<title>Principles of Transaction Processing</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Транзакции. Принципы ACID транзакционной обработки данных.
Реализация подсистемы хранения с использованием журнала.
</para>
<para>
Принцип двойной записи. Понятие истории изменений.
Стратегии NO UNDO, NO REDO. Стратегии STEAL, NO STEAL.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<title>Database systems, the complete book</title>
<author><personname>
Hector Garcia-Molina, Jeffrey D. Ullman,
Jennifer Widom
</personname></author>
</biblioentry>
<biblioentry>
<author><personname>
Gerhard Weikum, Gottfried Vossen
</personname></author>
<title>Transactional Information Systems: Theory,
Algorithms, and the Practice of Concurrency Control and
Recovery </title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Использование блокировок для управления транзакциями.
Понятие расписания. Теорема 2PL.
</para>
<para>
Понятие расписание. Сериальные и сериализуемые расписания.
Классы расписаний. Теорема 2PL: формулировка. Построение
графа зависимостей транзакций. Доказательство.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Gerhard Weikum, Gottfried Vossen
</personname></author>
<title>Transactional Information Systems: Theory,
Algorithms, and the Practice of Concurrency Control and
Recovery </title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Управление блокировками.
</para>
<para>
Иерархические блокировки. Специальные блокировки. Дедлоки.
Приоритеты локов. Понятие hot spot. Алгоритмы поиска
дедлоков. Понятие насыщения системы массового обслуживания
в применении к транзакционной системе.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Dennis Shasha, Philippe Bonnet
</personname></author>
<title>Database Performance Tuning: Principles, Experiments
and Troubleshooting Techniques</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Оптимистичные алгоритмы управления транзакциями.
</para>
<para>
Понятие оптимистичного управления транзакциями.
Валидация. Временные метки. Правила установки меток.
Протокол многоверсионного управления транзакциями.
</para>
<bibliolist>
<biblioentry>
<author><personname>
C. Mohan
</personname></author>
<title>
ARIES: A Transaction Recovery Method Supporting
Fine-Granularity Locking and Partial Rollbacks
Using Write-Ahead Logging
</title>
</biblioentry>
</bibliolist>
</listitem>
</orderedlist>
</section>
<section>
<title>Масштабирование и высокая доступность</title>
<orderedlist>
<listitem>
<para>Горизонтальное масштабирование СУБД</para>
<para>
Принцип эластичности. Шардинг. Консистентное хэширование.
Алгоритм Guava.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>
Jason Baker, Chris Bond, James C. Corbett, JJ
Furman, Andrey Khorlin, James Larson,
Jean-Michel Leon, Yawei Li, Alexander Lloyd,
Vadim Yushprakh
</personname></author>
<title>
Megastore: Providing Scalable, Highly
Available Storage for Interactive Services
</title>
</biblioentry>
<biblioentry>
<author><personname>
David Karger Eric Lehman Matthew Levine Tom
Leighton Rina Panigrahy Daniel Lewin
</personname></author>
<title>
Consistent Hashing and Random Trees:
Distributed Caching Protocols for Relieving
Hot Spots on the World Wide Web
</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Введение в распределённые системы. Протокол 2PC.
</para>
<para>
Понятие распределённой системы. Свойства Safety и Liveness.
Дилемма двух генералов. Результат Фишера-Линча-Паттерсона.
Протокол 2PC. Возможные оптимизации.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>Ken Birman</personname></author>
<title>A History of the Virtual Synchrony Replication Model</title>
</biblioentry>
<biblioentry>
<author><personname>
Eric Brewer
</personname></author>
<title>
Towards Robust Distributed Systems
</title>
</biblioentry>
<biblioentry>
<author><personname>
Nancy Lynch and Seth Gilbert
</personname></author>
<title>
Brewer's conjecture and the feasibility of consistent, available, partition-tolerant web services
</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Репликация. Разрешение конфликтов. Векторное время.
</para>
<para>
Принципы работы асинхронной репликации.
Задачи решаемые семи-синхронной и синхронной репликацией.
Включение и исключение узлов из распределённой реплицированной
системы без введения единой точки отказа. Мульти-мастер
репликация и понятие репликационного конфликта.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<title>
Dynamo: Amazon’s Highly Available Key-value Store
</title>
<author><personname>
Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati,
Avinash Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall
and Werner Vogels
</personname></author>
</biblioentry>
<biblioentry>
<author><personname>
James C. Corbett, Jeffrey Dean, Michael Epstein, Andrew Fikes,
Christopher Frost, JJ Furman, Sanjay Ghemawat, Andrey Gubarev,
Christopher Heiser, Peter Hochschild, Wilson Hsieh, Sebastian
Kanthak, Eugene Kogan, Hongyi Li, Alexander Lloyd, Sergey
Melnik, David Mwaura, David Nagle, Sean Quinlan, Rajesh Rao,
Lindsay Rolig, Yasushi Saito, Michal Szymaniak, Christopher
Taylor, Ruth Wang, Dale Woodford
</personname></author>
<title>Spanner: Google’s Globally-Distributed Database</title>
</biblioentry>
<biblioentry>
<author><personname>Colin J. Fidge</personname></author>
<title>Timestamps in Message-Passing Systems That Preserve the Partial Ordering</title>
</biblioentry>
<biblioentry>
<author><personname>Jim Gray, Pat Helland, Patrick O’Neil, Dennis Shasha</personname></author>
<title>The Dangers of Replication and a Solution</title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Консистентность распределённого ДКА. Алгоритм Paxos.
</para>
<para>
Paxos: разбор алгоритма. Multi-Paxos.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<author><personname>Leslie Lamport, Robert Shostak, Marshall Pease</personname></author>
<title>The Byzantine Generals Problem</title>
</biblioentry>
<biblioentry>
<author><personname>Diego Ongaro, John Ousterhout</personname></author>
<title>In Search of an Understandable Consensus Algorithm</title>
</biblioentry>
<biblioentry>
<author><personname>Jun Rao, Eugene J. Shekita, Sandeep Tata</personname></author>
<title>Using Paxos to Build a Scalable, Consistent,
and Highly Available Datastore</title>
</biblioentry>
<biblioentry>
<author><personname>Leslie Lamport</personname></author>
<title>Time, clock and ordering of events in distributed systems</title>
</biblioentry>
<biblioentry>
<author><personname>Leslie Lamport</personname></author>
<title>Paxos Made Simple</title>
</biblioentry>
<biblioentry>
<author><personname>C.A.R. Hoare</personname></author>
<title>Communicating Sequential Processes</title>
</biblioentry>
<biblioentry>
<author><personname>Parisa Jalili Marandi</personname></author>
<title>Multi-ring paxos </title>
</biblioentry>
</bibliolist>
</listitem>
<listitem>
<para>
Задача репликации журнала БД. Алгоритм Raft.
</para>
<para>
Raft: разбор алгоритма. Задача смены конфигурации. Оптимизации.
</para>
<bibliolist>
<title>Литература</title>
<biblioentry>
<title>
Chord: A Scalable Peer-to-peer Lookup Service for Internet
Applications
</title>
<author><personname>
Ion Stoica, Robert Morris, David Karger, M. Frans Kaashoek, Hari Balakrishnan
</personname></author>
</biblioentry>
<biblioentry>
<author><personname>
Indranil Gupta Tushar D. Chandra German S. Goldszmidt
</personname></author>
<title>On Scalable and Efficient Distributed Failure Detectors</title>
</biblioentry>
<biblioentry>
<author><personname>André Allavena, Alan Demers, John E. Hopcroft</personname></author>
<title>Correctness of a Gossip Based Membership Protocol</title>
</biblioentry>
</bibliolist>
</listitem>
</orderedlist>
</section>
</article>
<!--
vim: tw=66 syntax=docbk
vim: spell spelllang=en_us
-->