こんにちは。TRUSTDOCKでエンジニアリングマネージャーをしている保屋野です。
2024年8月3日〜4日にかけて開催されたSRE NEXT 2024に参加してきました。私はこれまで、バックエンドやフロントエンドを中心にアプリケーション開発の領域でキャリアを積んできましたが、SREの領域にはまだまだ知見が浅い状態です。
そんな中、弊社でSREチームを牽引している五島が登壇することとなり、私もオフラインでこの大規模なイベントに参加することを決め、この機会を通じて新たな学びが得られるのではないかという期待を胸に、会場へと足を運びました。
今回のブログでは、SRE NEXT 2024に参加した体験をレポートし、その中で感じたことや学びを共有したいと思います。SREの世界に触れることで、自分がどのような気づきを得たのか、少しでも皆さんの参考になれば幸いです。
SRE NEXT 2024のオフラインイベントは、渋谷のAbema Towersで開催されました。当日は週末ということもあり、渋谷の街は大勢の人で賑わっていました。普段のカンファレンス参加では、道すがらエンジニアの方々とすれ違うことが多く、「あの人について行けば会場に着きそう」と思えることもありますが、今回は人混みの中でそれも難しく、地図を頼りに自力で会場を目指しました。
会場に到着すると、多くのエンジニアが集まっており、バナーボードやノベルティ配布所、ジョブボード、スポンサーブースなど、カンファレンスならではのスペースが並び、活気が溢れていました。こうしたオフラインの場では、参加することで会場の雰囲気からも刺激を受けられるのが魅力だなと感じます。
Speaker: @nari_ex
このセッションでは、企業ごとに異なる解決策が求められるインシデントレスポンスの改善に焦点が当てられました。特に、不確実性が高く、改善が難しいという課題に対して、インシデントレスポンスを評価するための成熟度モデルを用いた評価方法が提案され、非常に興味深い内容でした。
インシデント対応は、どうしても属人的な対応になりがちで、組織全体としてどの程度のレベルで対応できているのかが把握しづらいという問題があります。私自身も、インシデント対応は習得が難しいと感じていましたが、このセッションでは、その課題に対する効果的なアプローチが示されていました。
具体的には、インシデント対応を「Post-Incidentフェーズ」「Responseフェーズ」「Pre-Incidentフェーズ」の3つに分類し、さらにそれぞれのフェーズのプロセスを細分化します。そして、各プロセスの成熟度を評価するために「Absent」「Reactive」「Proactive」「Strategic」の4段階の成熟度レベルを定義し、各プロセスの成熟度を評価できるようにすることで、段階的な改善ステップを踏めるようにしていきます。このアプローチにより、組織は自らのインシデント対応力を客観的に把握し、具体的な改善ポイントを明確にしながら、持続的に対応能力を向上させることが可能となります。
これらの構造を文章だけで理解するのは難しい部分もありますが、セッションでは構造化された図表が用いられ、非常に分かりやすく解説されていました。
課題解決には、要素を分解・分類し、一つずつ解決していくことが重要だと日頃から感じていましたが、インシデントレスポンスの改善においても同様で、このセッションで紹介されたアプローチ方法は、ぜひ試してみたいと感じさせるものでした。
また、成熟度モデルという概念自体も今回初めて知ったのですが、これがさまざまな場面で応用できる可能性があると感じました。個人的には、この成熟度モデルを知れただけでも、とても有意義なセッションだったと感じました。
Speaker: nakahira-isas
2日目に行われたKeynoteセッションは、特に心に残るものでした。
普段「JAXA」や「宇宙探査機」「人工衛星」といった言葉を耳にすると、私たちが日常的に使う技術とはまったく異なる、未知のものが使われていると反射的に思ってしまいがちです。
しかし、実際にはそうではなく、セッションを通じて、宇宙開発にもPythonで実装されたスクリプトやREST APIが使われていることが分かり、驚きとともに身近な技術の存在を感じました。さらに、開発の要求を整理する際には、テンションが上がるような画面を作ることで広報的にも効果的に活用できる、という話が出たときには、自分の中で意外な親近感が生まれる感覚がありました。
セッションでは、月面に着陸する際の軌道を描いた図や、探査機の各種パラメーターを確認するためのダッシュボードの動画が次々と共有され、そのリアルな資料の数々に自然と引き込まれていました。まるで小学生の頃の社会科見学で未知の技術に触れたときのような、純粋なワクワク感を久しぶりに感じました。いくつもカンファレンスに参加していた中でも強く印象に残る、素晴らしいKeynoteでした。
弊社からは、普段SREチームを牽引しているエンジニアの五島が「本人確認サービスにおける信頼性の定義とアラート対応の継続的改善」というテーマで発表を行いました。この発表では、本人確認という特定のドメインにおけるアラート運用について、日々の取り組みを基に、過去にあったアラートの取りこぼし事例を通してアラートの影響をどのように分類し、それぞれに対してどのように対応してきたかを詳しく伝える内容となっていました。
※ Photo by SRE NEXT Staff
私たちが日々取り組んでいるプロダクト開発やSREの活動は、常にテックコミュニティを中心とした豊かなエコシステムに支えられています。今回のカンファレンスでの登壇を通じて、少しでもこのエコシステムに貢献できていたら嬉しく思います。
2日間にわたって行われたSRE NEXT 2024も、終わってみればあっという間でした。このレポートでは紹介しきれなかった多くのセッションも、学びが多いものでした。
今回のSRE NEXTで特に印象的だったのは、登壇者と直接対話ができる「Ask the Speaker」という取り組みです。登壇者との対話を通じて、より深い理解や新たな視点を得ることができ、この取り組みは次回のSRE NEXTでもぜひ継続してほしいと思いました。
普段、エンジニアリングマネージャーとしてSREチームとやり取りする中で、可観測性の強化やSLOの設定・管理、自動化とインフラストラクチャーのコード化、インシデント対応とその事後分析といった、SRE領域の構造化された考え方や現実の課題を解決に導く実践には、常々刺激を受けています。今回のSRE NEXTでも、こうした領域で多くの刺激を受け、充実した時間を過ごすことができました。社内では、SRE NEXTで得られた学びを、早速SREチームから他チームに共有するといった動きもありました。
SRE NEXT 2024の開催を支えてくださったスタッフや登壇者のみなさん、素晴らしい会をありがとうございました。来年も楽しみにしています。
最後に、私たちはより良いサービスを提供するため共に切磋琢磨できるエンジニアを積極的に募集しています。
エンジニア求人一覧はこちら
まずは少し話を聞いてみたいという方向けに、カジュアル面談(オンライン)も随時受付しています。こちらより気軽にお声がけください。
採用情報
https://biz.trustdock.io/recruit/