福岡で開催しているSRE輪読会のリポジトリです。参加希望の方はそれらしい人にアポイント取って、あれをあれしてください。
- 1章 イントロダクション
- 2章 SREの観点から見た Googleのプロダクション環境
- 3章 リスクの受容
- 4章 サービスレベル目標
- 5章 トイルの撲滅
- 6章 分散システムのモニタリング
- 7章 Googleにおける自動化の進化
- 8章 リリースエンジニアリング
- 9章 単純さ
- 10章 時系列データからの実践的なアラート
- 11章 オンコール対応
- 12章 効果的なトラブルシューティング
- 13章 緊急対応
- 14章 インシデント管理
- 15章 ポストモーテムの文化:失敗からの学び
- 16章 サービス障害の追跡
- 17章 信頼性のためのテスト
- 18章 SREにおけるソフトウェアエンジニアリング
- 19章 フロントエンドにおけるロードバランシング
- 20章 データセンターでのロードバランシング
- 21章 過負荷への対応
- 22章 カスケード障害への対応
- 23章 クリティカルな状態の管理 :信頼性のための分散合意
- 24章 cronによる分散定期スケジューリング
- 25章 データ処理のパイプライン
- 26章 データの完全性:What You Read Is What You Wrote
- 27章 大規模なプロダクトのローンチにおける信頼性
- 29章 割り込みへの対処
- 30章 SREの投入による運用過負荷からのリカバリ
- 31章 SREにおけるコミュニケーションとコラボレーション
- 32章 進化する SREのエンゲージメントモデル
- 33章 他の業界からの教訓
- 34章 まとめ
- 1章 イントロダクション
- 2章 SREの観点から見た Googleのプロダクション環境
- 3章 リスクの受容
- 4章 サービスレベル目標
- 5章 トイルの撲滅
- 6章 分散システムのモニタリング
- 7章 Googleにおける自動化の進化
- 8章 リリースエンジニアリング
- 9章 単純さ
- 10章 時系列データからの実践的なアラート
- 11章 オンコール対応
- 12章 効果的なトラブルシューティング
- 13章 緊急対応
- 14章 インシデント管理
- 15章 ポストモーテムの文化:失敗からの学び
- 16章 サービス障害の追跡
- 17章 大規模なテスト
- 21章 過負荷への対応
- 27章 大規模なプロダクトのローンチにおける信頼性
- 28章 SREの成長を加速する方法:新人からオンコール担当、そしてその先へ
- 29章 割り込みへの対処
- 30章 SREの投入による運用過負荷からのリカバリ
- 会場
- ヌーラボ
- 発表者
- @matsuzj
- 内容
- 13章:緊急対応
- 14章:インシデント管理
- 会場
- ペパボ
- 発表者
- @to_takada
- 内容
- 1章 イントロダクション
- 2章 SREの観点から見た Googleのプロダクション環境
- 会場
- グルーヴノーツ
- 発表者
- @ryok0607
- 内容
- 11章:オンコール対応
- 12章:効果的なトラブルシューティング
- 会場
- ヌーラボ
- 発表者
- @matsuzj
- 内容
- 3章 リスクの受容
- 会場
- ペパボ
- 発表者
- @pyama86
- 内容
- 4章 サービスレベル目標
- 5章 トイルの撲滅
- 29章 割り込みへの対処
- 発表者
- @edvakf
- 会場
- ピクシブ福岡オフィス
- 内容
- 27章 大規模なプロダクトのローンチにおける信頼性
- 会場
- TheCompany 博多 1F
- 発表者
- @edvakf, @takumakume
- 内容
- 27章 大規模なプロダクトのローンチにおける信頼性(高山さん)
- 30章 SREの投入による運用過負荷からのリカバリ(久米さん)
- 会場
- ヌーラボ
- 発表者
- @tsurubee, @matsuzj
- 内容
- 10章 時系列データからの実践的なアラート(鶴田さん)
- 15章 ポストモーテムの文化:失敗からの学び(松浦さん)
- 会場
- ペパボ
- 発表者
- @inokappa, @matsuzj
- 内容
- 8章 リリースエンジニアリング(松浦さん)
- 資料はなく読みながら、ディスカッションを行う形式にした
- 9章 単純さ(鶴田さん)
- 8章 リリースエンジニアリング(松浦さん)
- 会場
- グルーヴノーツ
- 発表者
- @_takeshi_24, @rxpaki
- 内容
- 6章 分散システムのモニタリング(西さん)
- 7章 Googleにおける自動化の進化(松村さん) ]
- 会場
- ヌーラボ
- 発表者
- @futahashi, @tokibi
- 内容
- 16章 サービス障害の追跡 (二橋さん)
- 21章 過負荷への対応(田村さん)