Skip to content

sre-fuk/histories

Repository files navigation

histories

福岡で開催しているSRE輪読会のリポジトリです。参加希望の方はそれらしい人にアポイント取って、あれをあれしてください。

SRE本 目次

  • 1章 イントロダクション
  • 2章 SREの観点から見た Googleのプロダクション環境
  • 3章 リスクの受容
  • 4章 サービスレベル目標
  • 5章 トイルの撲滅
  • 6章 分散システムのモニタリング
  • 7章 Googleにおける自動化の進化
  • 8章 リリースエンジニアリング
  • 9章 単純さ
  • 10章 時系列データからの実践的なアラート
  • 11章 オンコール対応
  • 12章 効果的なトラブルシューティング
  • 13章 緊急対応
  • 14章 インシデント管理
  • 15章 ポストモーテムの文化:失敗からの学び
  • 16章 サービス障害の追跡
  • 17章 信頼性のためのテスト
  • 18章 SREにおけるソフトウェアエンジニアリング
  • 19章 フロントエンドにおけるロードバランシング
  • 20章 データセンターでのロードバランシング
  • 21章 過負荷への対応
  • 22章 カスケード障害への対応
  • 23章 クリティカルな状態の管理 :信頼性のための分散合意
  • 24章 cronによる分散定期スケジューリング
  • 25章 データ処理のパイプライン
  • 26章 データの完全性:What You Read Is What You Wrote
  • 27章 大規模なプロダクトのローンチにおける信頼性
  • 29章 割り込みへの対処
  • 30章 SREの投入による運用過負荷からのリカバリ
  • 31章 SREにおけるコミュニケーションとコラボレーション
  • 32章 進化する SREのエンゲージメントモデル
  • 33章 他の業界からの教訓
  • 34章 まとめ

終了項目

  • 1章 イントロダクション
  • 2章 SREの観点から見た Googleのプロダクション環境
  • 3章 リスクの受容
  • 4章 サービスレベル目標
  • 5章 トイルの撲滅
  • 6章 分散システムのモニタリング
  • 7章 Googleにおける自動化の進化
  • 8章 リリースエンジニアリング
  • 9章 単純さ
  • 10章 時系列データからの実践的なアラート
  • 11章 オンコール対応
  • 12章 効果的なトラブルシューティング
  • 13章 緊急対応
  • 14章 インシデント管理
  • 15章 ポストモーテムの文化:失敗からの学び
  • 16章 サービス障害の追跡
  • 17章 大規模なテスト
  • 21章 過負荷への対応
  • 27章 大規模なプロダクトのローンチにおける信頼性
  • 28章 SREの成長を加速する方法:新人からオンコール担当、そしてその先へ
  • 29章 割り込みへの対処
  • 30章 SREの投入による運用過負荷からのリカバリ

SRE 本 輪読会 #1 2017-09-25

  • 会場
    • ヌーラボ
  • 発表者
    • @matsuzj
  • 内容
    • 13章:緊急対応
    • 14章:インシデント管理

SRE 本 輪読会 #2 2017-11-06

  • 会場
    • ペパボ
  • 発表者
    • @to_takada
  • 内容
    • 1章 イントロダクション
    • 2章 SREの観点から見た Googleのプロダクション環境

SRE 本 輪読会 #3 2017-12-04

  • 会場
    • グルーヴノーツ
  • 発表者
    • @ryok0607
  • 内容
    • 11章:オンコール対応
    • 12章:効果的なトラブルシューティング

SRE 本 輪読会 #4 2018-03-05

  • 会場
    • ヌーラボ
  • 発表者
    • @matsuzj
  • 内容
    • 3章 リスクの受容

SRE 本 輪読会 #5 2018-04-04

  • 会場
    • ペパボ
  • 発表者
    • @pyama86
  • 内容
    • 4章 サービスレベル目標
    • 5章 トイルの撲滅
    • 29章 割り込みへの対処

SRE 本 輪読会 #6 2018-05-10

  • 発表者
    • @edvakf
  • 会場
    • ピクシブ福岡オフィス
  • 内容
    • 27章 大規模なプロダクトのローンチにおける信頼性

SRE 本 輪読会 #6 2018-05-10

  • 会場
    • TheCompany 博多 1F
  • 発表者
    • @edvakf, @takumakume
  • 内容
    • 27章 大規模なプロダクトのローンチにおける信頼性(高山さん)
    • 30章 SREの投入による運用過負荷からのリカバリ(久米さん)

SRE 本 輪読会 #7 2018-06-06

  • 会場
    • ヌーラボ
  • 発表者
    • @tsurubee, @matsuzj
  • 内容
    • 10章 時系列データからの実践的なアラート(鶴田さん)
    • 15章 ポストモーテムの文化:失敗からの学び(松浦さん)

SRE 本 輪読会 #8 2018-07-04

  • 会場
    • ペパボ
  • 発表者
    • @inokappa, @matsuzj
  • 内容
    • 8章 リリースエンジニアリング(松浦さん)
      • 資料はなく読みながら、ディスカッションを行う形式にした
    • 9章 単純さ(鶴田さん)

SRE 本 輪読会 #9 2018-08-08

  • 会場
    • グルーヴノーツ
  • 発表者
    • @_takeshi_24, @rxpaki
  • 内容
    • 6章 分散システムのモニタリング(西さん)
    • 7章 Googleにおける自動化の進化(松村さん) ]

SRE 本 輪読会 #10 2018-10-12

  • 会場
    • ヌーラボ
  • 発表者
    • @futahashi, @tokibi
  • 内容
    • 16章 サービス障害の追跡 (二橋さん)
    • 21章 過負荷への対応(田村さん)

About

開催履歴と資料置き場

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published