
もう一度読むSRE
By Topotal
SRE を今から知りたい方はもちろん、SRE の基礎を改めて学びたい方もぜひ視聴ください。Twitter のハッシュタグは #もう一度読むSRE です。

もう一度読むSREOct 25, 2023

もう一度読むSRE #83
23.1 合意を利用する目的:分散システムの協調障害 から 23.1.3 ケーススタディ 3:問題のあるグループメンバーシップアルゴリズム まで

もう一度読むSRE #82
23章 クリティカルな状態の管理: 信頼性のための分散合意

もう一度読むSRE #81
SRE NEXT 2023 Chair ぐりもおさん をゲストに迎え、SRENEXTのことをお聞きしました。

もう一度読むSRE #80
22.6 カスケード障害に対応するためにすぐに行うべき手順 から 22.7まとめまで

もう一度読むSRE #79
22.4 カスケード障害を引き起こす条件 から 22.5.3 重要度の低いバックエンドのテスト まで

もう一度読むSRE #78
22.3 起動直後の低パフォーマンスとコールドキャッシュ から 22.3.1 スタックは常に下っていくようにすること まで

もう一度読むSRE #77
22.2.4 レイテンシとタイムアウト から 22.2.4.4 二峰性のレイテンシ まで

もう一度読むSRE #76
22.2.2 ロードシェディングとグレースフルデグラデーション から 22.2.3 リトライ まで

もう一度読むSRE #75
22.1.3 利用できないサービス から 22.2.1 キューの管理 まで

もう一度読むSRE #74
22章 カスケード障害への対応 から 22.1.2.5 リソース間の依存関係 まで
本編は12分05秒あたりからになります。

もう一度読むSRE #73
21.7 接続によって生じる負荷 から 21.8 まとめ まで

もう一度読むSRE #72
21.5 利用率のシグナル から 21.6.1 リトライの判断 まで

もう一度読むSRE #71
21.3 クライアント側でのスロットリング から 21.4 重要度 まで

もう一度読むSRE #70
21章 過負荷への対応 から 21.2 顧客単位での制限 まで

もう一度読むSRE #69
20.4 ロードバランシングのポリシー から 20.4.1.3 マシンのばらつき まで

もう一度読むSRE #68
20.3.3 サブセット選択のアルゴリズム : 決定的なサブセット選択

もう一度読むSRE #67
20.3 サブセットの設定によるコネクションプールの制限 から 20.3.2 サブセットの選択アルゴリズム:ランダムなサブセットの選択 まで

もう一度読むSRE #66
20章 データセンターでのロードバランシング から 20.2.2 不健全なタスクへの確実なアプローチ:レイムダック状態 まで

もう一度読むSRE #65
19.3 仮想 IP アドレスでのロードバランシング まで

もう一度読むSRE #64
19章 フロントエンドにおけるロードバランシング から 19.2 DNS を使ったロードバランシング まで

もう一度読むSRE #63
18.3.5 チームの力学 から 18.5 まとめ まで

もう一度読むSRE #62
18.3.4 認知の向上と採用の推進 から 18.3.4.4 適切なレベルでの設計 まで

もう一度読むSRE #61
18.3.2 Auxon の紹介 から 18.3.3.1 近似 まで

もう一度読むSRE #60
<li>18.2.2 Google におけるソリューション:インテントベースのキャパシティプランニング から 18.3.1.2 パフォーマンスメトリクス まで</li>
</ul>

もう一度読むSRE #59
18章 SRE におけるソフトウェアエンジニアリング から 18.2 Auxon のケーススタディ:プロジェクトの背景と問題の領域 まで

もう一度読むSRE #58
17.3.7 プロダクション環境におけるプローブ から 17.4 まとめ まで

もう一度読むSRE #57
17.3.6 結合 まで

もう一度読むSRE #56
17.3.5 予想されるテストの失敗 まで

もう一度読むSRE #55
17.3.4 プロダクションへのプッシュ

もう一度読むSRE #54
17.3.2 ディザスタのテスト から 17.3.3 速度の重要性 まで

もう一度読むSRE #53
17.3 大規模なテスト から 17.3.1 スケーラブルなツールのテスト まで

もう一度読むSRE #52
17.2 テストの作成と環境の構築 まで

もう一度読むSRE #51
17.1.2.2 ストレステスト から 17.1.2.3 カナリアテスト まで

もう一度読むSRE #50
17.1.2 プロダクションテスト から 17.1.2.1 設定テスト まで

もう一度読むSRE #49
17 信頼性のためのテスト から 17.1 ソフトウェアテストの種類 まで

もう一度読むSRE #48
16章 サービス障害の追跡 から 16.2.4 予想外のメリット まで

もう一度読むSRE #47
15章 ポストモーテムの文化: 失敗からの学び から 15.4 まとめと改善の継続 まで

もう一度読むSRE #46
15章 ポストモーテムの文化: 失敗からの学び から 15.1 Google におけるポストモーテムの哲学
本編は3分35秒からです。

もう一度読むSRE #45
14.3 インシデント管理のプロセスの構成要素 から 14.5 インシデントと宣言すべき場合 まで
本編は11分00秒からです。

もう一度読むSRE #44
13.6 過去から学び、繰り返さない から 14.3.4 はっきりとした引き継ぎ まで
本編は6分22秒からです。

もう一度読むSRE #43
13.4 プロセスが引き起こした緊急事態 から 13.5 解決できない問題は存在しない まで
本編は3分10秒からです。

もう一度読むSRE #42
13.3 変更が引き起こした緊急事態 から 13.3.3.2 学んだこと まで
本編は4分10秒からになります。

もう一度読むSRE #41
13章 緊急対応 から 13.2.3.2 学んだこと まで
本編は5分50秒からになります。

もう一度読むSRE #40
12.4 ケーススタディ から 12.6 まとめ まで
今回雑談はありません。

もう一度読むSRE #39
12.2.5 テストと対応 から 12.3 否定的な結果の素晴らしさ まで
今回雑談はありません。

もう一度読むSRE #38
12.2.4 診断から 12.2.4.4 特定の診断 まで
本編は4分03秒からです。

もう一度読むSRE #37
12.2 実践 から 12.2.3 検証 まで
雑談はありません。

もう一度読むSRE #36
12章 効果的なトラブルシューティング から 12.1 理論 まで
本編 : 03:10〜

もう一度読むSRE #35
11.5 不適切な負荷の回避 から 11.6まとめ まで
本編 : 03:45〜

もう一度読むSRE #34
11.3 バランスの取れたオンコール から 11.4 安心感 まで
本編 : 00:00〜
※今回雑談はありません。