はじめまして! ネットプロテクションズでatoneのインフラエンジニアを担当しているたなべです。
2026年1月31日(土)に開催された「SRE Kaigi 2026」に初参加してきました。
今回は、イベントの概要と、特に印象に残ったセッションでの学びをレポートします。

SRE Kaigi とは?
SRE Kaigiは、Webサービスの信頼性を支える Site Reliability Engineering (SRE) をテーマにした、エンジニア主導のコミュニティカンファレンスです。
2025年の初開催に続き、今回が第2回となるフレッシュで熱量の高いイベントです。
今年のテーマは 「Challenge SRE!」。 信頼性を「守る」だけでなく、AI活用や領域拡張など、SREがどう「攻め」に転じていくかという趣旨のセッションが多く見られました。
なお、ネットプロテクションズも 「カイロスポンサー」 として協賛しました!
聴講セッションの振り返り
当日聴講した中から、特に学びの深かったセッションをピックアップして紹介します。
1. モノタロウにおけるSREの現在地:モダナイゼーションの過程で変化していく中でSREはどう向き合って来たか
長期運用されているシステムにおいて、技術的なモダナイゼーションと組織の変化にSREがどう追従してきたかという事例紹介でした。
【刺さった点】 特にSLI/SLOの策定において、エンジニアリングの枠を超えて泥臭い検討や対話を重ねている点は、多くのSREが目指すべき姿だと感じました。 どのような規模の組織であっても、こうした「対話」こそがカルチャーを作る第一歩なのだと感じました。
2. 制約が導く迷わない設計 - 信頼性と運用性を両立するマイナンバー管理システムの実践
法令遵守や極めて高い信頼性が求められる「マイナンバー管理システム」の設計において、制約を明確にして迷いのない設計判断を実現した話です。
【刺さった点】 「Any Decision Records」が非常に実践的だと感じました。一般的にアーキテクチャ選定の経緯を残す「ADR (Architecture Decision Records)」が知られています。しかしここではアーキテクチャに限らず「あらゆる決定事項」を記録し、定期的に読み合わせを行っているそうです。 「なぜその設計にしたのか?」は時間の経過とともに風化しがちです。「迷わない設計」をするだけでなく、未来のメンバーが「迷わない運用」をするためのドキュメント文化として、すぐにでも取り入れたい手法でした。
3. 小さく始めるBCP―多プロダクト環境で始める最初の一歩
事業継続計画(BCP)を導入するにあたり、多プロダクト環境でどう現実的な解を見つけるかというセッションでした。
【刺さった点】 BCPはどこまで手を付ければよいのか判断が難しいのが常ですが、「最初から100点を目指さない」というスタンスが印象的でした。 コストや運用負荷を天秤にかけ、まずは不確実性を減らすところから始める。スモールスタートで手順作成や訓練を回していくアプローチは、SREの基本である「反復的な改善」そのものだと感じました。
4. レガシー共有バッチ基盤への挑戦 - SREドリブンなリアーキテクチャリングの取り組み
長年の運用でブラックボックス化していたバッチ基盤を、SRE主導でリアーキテクチャリングしていく事例です。
【刺さった点】 ブラックボックスなアーキテクチャに対して解像度を上げるプロセスが非常に参考になりました。 チームメンバーそれぞれが現状基盤の実機調査・分析を行い、持ち寄った構成図をベースにディスカッションするアプローチは、一般的なリアーキテクチャに応用できる汎用的な手法だと感じました。
5. 認知負荷を最小化するオブザーバビリティとSLOの導入―4名のSREが200名のプロダクトエンジニアを支援
少人数のSREチームで、大規模なプロダクトの信頼性をどう向上させるかという話です。
【刺さった点】 キーワードは「認知負荷の最小化」と「責任分界点」でした。 SREが全てを監視するのではなく、プロダクトチームが自律的に分析できる環境(ダッシュボードや手順書)を用意する。その際、チームごとの分析品質にブレが出ないよう、APM(Application Performance Monitoring)のダッシュボード自体に説明を埋め込むなどの工夫が紹介されていました。 「ツールを入れるだけではオブザーバビリティは向上しない」という本質を突いたセッションでした。
6. ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
開発スピードを落とさずにセキュリティレベルをどう担保するか、AIセキュリティ診断ツール「Takumi byGMO」の導入事例を中心に語られました。
【刺さった点】 「AIを用いた攻撃には、AIで立ち向かう」というフレーズが印象的でした。 人力の検知には限界があり、かといって自前でLLMを用いた防御システムを運用するのはリスクが高い。そうした課題に対し、信頼できるソリューションにオフロードすることで、SREは本来の「信頼性向上」や「開発速度向上」にフォーカスできるのだと学びました。
まとめ:「安全に失敗する」からこそ、挑戦できる
SRE Kaigi全体を通して共通していたのは、「小さく早く失敗する」「失敗から学んで修正する」というマインドセットでした。
今年のテーマ「Challenge SRE!」にもありますが、オブザーバビリティやBlameless Postmortemといった「失敗しても安心できる仕組みやカルチャー」があるからこそ、私たちは恐れずにChallengeできるのだと再認識しました。
また、想像よりも多くの方が参加していて、SREの人口と関心の高さを改めて実感しました。
懇親会では他社エンジニアの方とも交流でき、改めてオフライン開催のメリットを享受できたと思っています。
改めて、登壇・運営された方々、参加された方々お疲れ様でした。また来年お会いしましょう!