SRE Advent Calendar 25日目の記事です。
SRE Advent Calendar 2018 - Qiita
SRE 2 Advent Calendar 2018 - Qiita
SRE Advent Calendar を振り返ります。
全記事の振り返り
Day1
SRE Advent Calendar の1日目公開しました!!!
— かつひささん (@katsuhisa__) 2018年12月1日
監視システムを網にたとえて特徴を記述してみました。
はてなブログに投稿しました #はてなブログ
[SRE Advent Calendar] 監視システムの特徴…https://t.co/yq1XXVuMkG
Day2
SRE Advent Calendar の2日目!
— かつひささん (@katsuhisa__) 2018年12月4日
地道に一つずつはじめようとしている話でよい。
引き続き応援しています!!!
弊社におけるSREという考え方の推進 - reizist's blog https://t.co/L1CxULfM2v
Day3
SRE Advent Calendar の3日目!
— かつひささん (@katsuhisa__) 2018年12月4日
ポストモーテムについて深掘りされている。
すごく共感できる内容が多い。
ポストモーテムにおける根本原因分析 - 夜は寝る https://t.co/jQnHIFS6rK
Day4
SRE Advent Calendar 4日目の記事!
— かつひささん (@katsuhisa__) 2018年12月5日
まずはいろんなログちゃんと集約しましょうというお話でよい。
“SREとしてデータを元に改善できるチームになる” by Toshihumi Anan https://t.co/922YHK6SFB
SRE Advent Calendar 2 の記事!
— かつひささん (@katsuhisa__) 2018年12月4日
データ基盤をSRE が兼任して見ている会社はすごく多いし、素晴らしい知見だ。
データ基盤の分類も分かりやすい。
データ基盤をHadoopからBigQueryに移管するときのアンチパターン - 下町柚子黄昏記 by @yuzutas0 https://t.co/iGv2zjVsfD
Day5
SRE Advent Calendar の5日目の記事。
— かつひささん (@katsuhisa__) 2018年12月5日
DB のチューニングの話で、すごくよくまとまっていてよい。
【SRE】成長するサービスとDB負荷との闘い https://t.co/aPZM4qp5rL
SRE Advent Calendar 2の本日分の記事が公開された!
— かつひささん (@katsuhisa__) 2018年12月4日
> 機械的な通知で警告が無視されてはいけないと思い、代表の口調に寄せ、人が言っている感を大事にしました
知見だ……
日々の運用改善の積み重ねが喜びに フォルシアのSREの真髄│FORCIA CUBE│フォルシア株式会社 https://t.co/Nl73TjQW2Y
Day6
SRe Advent Calendar 6日目の記事!
— かつひささん (@katsuhisa__) 2018年12月6日
モニタリングについて体系立てて書かれている力作。よい。
監視の通知とメンテナンスについて https://t.co/SrcNVbss1I
Day7
SRE Advent Calenda 7日目!
— かつひささん (@katsuhisa__) 2018年12月6日
同僚のエルが趣味開発での可視化の話について書いてくれました!
いろいろ監視ツールの比較がまとまっていて良い記事。
手軽に可視化したい – valeblog https://t.co/TwCvVU8Ed9
Day8
SRE Advent Calendar 8日目!
— かつひささん (@katsuhisa__) 2018年12月7日
性能面の課題にどう向き合ったか、向き合っているかというお話。いろいろと苦労が垣間見える。
引き続き応援しております!
わたし(たち)がSREに至るまでの道のり
https://t.co/oyEBTTowbP #qrunch
Day9
SRE Advent Calendar 9日目!
— かつひささん (@katsuhisa__) 2018年12月9日
HAproxy の利用に関する背景補足などが丁寧で分かりやすい。
こういうのもSRE の仕事として素晴らしいですなー。
Multi-AZ構成におけるネットワーク遅延を考慮して参照クエリを振り分ける https://t.co/UMUlt20Yfr
SRE Advent Calendar 2 の9日目。
— かつひささん (@katsuhisa__) 2018年12月10日
Docker の init process についての解説と、コンテナオーケストレーションで同様の設定を維持するにはどうすればよいかに想いを馳せた記事!
Docker と --init とコンテナオーケストレーションでの設定について - def yasuharu519(self): https://t.co/04V0agUZvn
Day10
SRE Advent Calendar 10日目!
— かつひささん (@katsuhisa__) 2018年12月10日
SRE を実践するにあたっての、組織の問題に焦点を当てた素晴らしい記事だ。
DevOps文化の組織にSRE活動を導入した話 - 好奇心の足跡 https://t.co/mK73S62pHS
Day11
SRE Advent Calendar 11日目!
— かつひささん (@katsuhisa__) 2018年12月11日
SLI の定義や計測の話で、素晴らしい取り組み!これはうちでもいろいろ参考にさせていただこう。
サービス品質向上のためにBacklogのSREが行ってきたサービスレベル管理の取り組み | ヌーラボ https://t.co/PgqJy0iGXJ
SRE Advent Calendar 2 の今日の記事!dely さんでのAWS 料金可視化に関する内容。うちのこのへんの整備ちゃんとやっていきたい。
— かつひささん (@katsuhisa__) 2018年12月12日
AWSの意図しない料金の上昇に気付く仕組み - dely engineering blog https://t.co/s7Soyu5JR1
Day12
SRE Advent Calendar 本日分きた!
— かつひささん (@katsuhisa__) 2018年12月12日
みてねSRE 清水さんの記事。いろいろ取り組んでらっしゃることがまとまっていて参考になる。
AWS サポートプラン、エンタープライズは羨ましい。
みてねのSREが2018年に取り組んできたこと https://t.co/CnHXG051XQ
Day13
SRE Advent Calendar 本日分!今日は、はてな の方が書いてくださった!
— かつひささん (@katsuhisa__) 2018年12月13日
割れ窓ラベルめっちゃよい。うちもつくろうかな。
ぜひSRE Loungにもご登壇いただきたい!
割れ窓理論をWebインフラの改善に活用し、チーム内の知識共有を促進している話 - 実はhokkai7go https://t.co/L4c9CDyFrV
Day14
渋谷さんのSRE Advent Calendar の記事!
— かつひささん (@katsuhisa__) 2018年12月15日
プロダクト開発チームの一員としてSREメンバーが所属する形式にしようとしてる会社は多いなー。
うちもかなりそっちに近い形になりつつある。
プロダクト横断のSREチームを組成したい話 https://t.co/WIHJywVYVv
Day15
SRE Advent Calendar 15日目の記事!
— かつひささん (@katsuhisa__) 2018年12月15日
SRE についての定義や実際やってみて感じるところがまとめられていてよい。共感できる箇所も多い。
拝啓:SRE三年生より。 https://t.co/GMAUjlUZVR @srockstyleより
SRE Advent Calendar 2 の本日分の記事。
— かつひささん (@katsuhisa__) 2018年12月16日
SREとして何をしているのか、どう感じているかが書かれている。
「単純にサービス運用年数が経過するだけでも対処が必要な問題が起こり」というコメントにすごく共感する。
SRE2 アドベントカレンダー · GitHub https://t.co/GC0XXCLAg7
Day16
SRE Advent Calendar 16日目!
— かつひささん (@katsuhisa__) 2018年12月16日
SLO設定や監視についての実践内容がまとめられている。Elasticsearchまわりの内容が個人的には特に参考になる。SRE Advent Calendar 各社の知見が集まっていて本当によい。
SLO設定/超過監視にまつわる活動の振り返り - エムスリーテックブログ https://t.co/DkCa3RJnsD
Day17
SRE Advent Calendar 昨日分!
— かつひささん (@katsuhisa__) 2018年12月17日
相変わらずのAnsible 熱w
Ansible で cron を管理する https://t.co/nphDyzY443 @curry9999さんから
SRE Advent Calendar こちらも昨日分!同僚のエルが二記事目を書いてくれて頼もしい!
— かつひささん (@katsuhisa__) 2018年12月17日
Elasticsearch/Grafana の利用事例ってそんなに多くない気がするので、貴重な気がする!
分散型SNSの可視化https://t.co/gD3h1PqWef
Day18
SRE Advent Calendar 18日目!
— かつひささん (@katsuhisa__) 2018年12月17日
脆弱性診断など、セキュリティまわりの施策について詳しく書かれている。
SRE がこのへんのこともやってる会社もすごく多いですよねー。
Webセキュリティ対策例 https://t.co/0DNUwJkdEx
Day19
SRE Advent Calendar 本日分!
— かつひささん (@katsuhisa__) 2018年12月18日
SRE 本がいかに素晴らしいかがひたすら書いてあって、SRE 本愛が伝わってくるw
SRE本の素晴らしさについて語ってみる - もりはやメモφ(・ω・ ) https://t.co/NPdMMUa01U
Day20
SRE Advent Calendar 昨日分の @gkuga さんの記事!SRE の考え方を組織に定着させるためにどうするか?に思考を深めていておもしろい。
— かつひささん (@katsuhisa__) 2018年12月21日
わかってる、俺たちは雰囲気でSREをやっている。 - 週刊便代 https://t.co/Vp5KoBiKNM
Day21
SRE Advent Calendar 本日分!
— かつひささん (@katsuhisa__) 2018年12月21日
OnCall に対して様々な観点で思考を深められている。分かりやすくまとまっていて読みごたえがある。
時間外対応の保証など、このあたりは本当に難しいですよね。
SRE Workbook CHAPTER 8 On-Call から学べること https://t.co/b0JJ9L9wGN
こちらは、SRE Advent Calendar 2 の昨日分。
— かつひささん (@katsuhisa__) 2018年12月21日
Grafana のダッシュボードの挙動について検証した内容がまとまってる。
エルはこれでSRE Advent Calendar 2 への寄稿が3記事目で勢いがすごいw
Getting that system dashboard working
https://t.co/g5W4ir65It
Day22
SRE Advent Calendar 本日分!
— かつひささん (@katsuhisa__) 2018年12月22日
プライベートからパブリッククラウドへの移行について細かくまとめた超大作!すごいなー。
Pubs/AdventCalendar/2018/プライベートからパブリッククラウドへの移行 - https://t.co/SgVhp6ivl8 https://t.co/WvbzVTpcgw
こちらはSRE Advent Calendar 2の本日分!
— かつひささん (@katsuhisa__) 2018年12月22日
CI でOSS ライセンスをチェックするには、言語別のソリューションでやると良いよ、という知見が得られた。こちらも良い記事だ。
CIでOSSライセンスを自動チェック ~npm, pip編~ - 好奇心の足跡 https://t.co/5VJpdr54mc
Day23
SRE Advent Calendar 23日目!
— かつひささん (@katsuhisa__) 2018年12月23日
ブロックチェーンでサービスをつくる時には2018年現在では、継続デプロイの概念が通用しない背景などが書いてあっておもしろい。「さてここまでが、前提知識になります。」までが膨大w
ある日、ブロックチェーンでサービスを作ることになったら https://t.co/WqCtjOBXmD
SRE Advent Calendar 2の23日分!
— かつひささん (@katsuhisa__) 2018年12月25日
信頼性の高いサービス運用のために意識すべき要素がうまくまとめられている!よい!
信頼性の高いサービス運用のための5つの要素 - ブログなんだよもん https://t.co/mrv7kfKZno
Day24
SRE Advent Calendar 昨日分!
— かつひささん (@katsuhisa__) 2018年12月25日
SRE としての考え方や取り組みが、色んな観点からまとまっていてよい。
SREチームへの短期留学は、前回のSRE Loungeでのfreeeさんの発表にもありましたねー。
SRE風のインフラエンジニアにならないために - Work Records https://t.co/txv1IfUhIX
Day25
SRE Advent Calendar 2018 の最終記事を書きました!!!これにて終了!
— かつひささん (@katsuhisa__) 2018年12月25日
SRE Advent Calendar 2018 を終えて - かつひささんの日記https://t.co/o1qJq8mzlY
@katsuhisa__的ベスト3
さいごに、個人的に印象に残った記事のベスト3をがんばって選んでみます!
3位. 割れ窓理論をWebインフラの改善に活用し、チーム内の知識共有を促進している話
ゴミが散らかると、いやな気持ちになるので、それをみんなで解消していくための時間を設けている話。
リリースから時間が経つと、はじめはこれでいいや、と思っていたものがどんどんなおしたい気持ちになっていくものなので、この記事の内容にはすごく共感できたし、うちも真似したいなー、と思いました。
はてなさん、ぜひSRE Lounge にもご登壇いただきたい・・・!(とツイートしたところ、この記事の作者の方に拾っていただきました。いつかご登壇依頼をします!ありがとうございます!)
「SLO を設定しよう」とは言っても、いろんな会社の人と会話をする中で、なかなか超過時のポリシー運用にまで落とし込めている会社さんは少ないなー、というのが私の印象でした。
この記事では、具体的に超過時のポリシーについて詳しく触れられており、非常に参考になる内容です。
エムスリーさん、ぜひSRE Lounge にもご登壇いただきたい・・・!
1位. サービス品質向上のためにBacklogのSREが行ってきたサービスレベル管理の取り組み
ヌーラボSREの吉澤さんのこちらの記事が、SRE Advent Calendar 2018 の@katsuhisa__ 的1位でした。
SREの文脈では、一般的に、SLI といえば、レイテンシやエラーレートを指すことが多いですが、この記事では、自社のチームの課題に焦点を当て、社内向けSLI を整備した話が書かれています。
私が登壇する資料では、度々「ウェブオペレーションは、技芸であり、科学ではない」( by 『ウェブオペレーション ―サイト運用管理の実践テクニック』 )という言葉を引用しますが、まさにこの記事の事例には、一種の技芸を感じました。
また、それ以外にもSREと組織構造にも詳しく触れられていて、今後も何回も読み返したくなるような内容でした。
さいごに
SRE Advent Calendar 2018 は、総勢33名の方にご参加いただきました。ご参加いただいた皆さん、本当にありがとうございました。
上記で、私がベスト3に選出しなかった記事の中にも、素晴らしい記事が本当にたくさんあるので、みなさん年末年始の帰省時にでも、ぜひお読みください!
来年もぜひつくろうと思いますので、その際は、またよろしくおねがいします!次は、ぜったいにハッシュタグつけるぞ・・・!
本当にみなさんありがとうございました!!!少し早いですが、良いお年を。