Soumettre la recherche
Mettre en ligne
SRE CH28 - Accelerating SREs to On-Call and Beyond
•
1 j'aime
•
2,079 vues
Rick Hwang
Suivre
SRE CH28 - Accelerating SREs to On-Call and Beyond
Lire moins
Lire la suite
Ingénierie
Signaler
Partager
Signaler
Partager
1 sur 29
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
Rick Hwang
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
Rick Hwang
SRE Study Notes - Opening, CH1
SRE Study Notes - Opening, CH1
Rick Hwang
Scrum过程介绍
Scrum过程介绍
ben
專案進度追蹤
專案進度追蹤
黑狗 大
微型團隊的 web 程式開發流程
微型團隊的 web 程式開發流程
Chang Mt
從廢柴到成材 - 那 20 個 sprints 教會我們的事 C.C Agile #40
從廢柴到成材 - 那 20 個 sprints 教會我們的事 C.C Agile #40
diro fan
Software Project Risk Management
Software Project Risk Management
Andy Liu
Recommandé
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
Rick Hwang
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
Rick Hwang
SRE Study Notes - Opening, CH1
SRE Study Notes - Opening, CH1
Rick Hwang
Scrum过程介绍
Scrum过程介绍
ben
專案進度追蹤
專案進度追蹤
黑狗 大
微型團隊的 web 程式開發流程
微型團隊的 web 程式開發流程
Chang Mt
從廢柴到成材 - 那 20 個 sprints 教會我們的事 C.C Agile #40
從廢柴到成材 - 那 20 個 sprints 教會我們的事 C.C Agile #40
diro fan
Software Project Risk Management
Software Project Risk Management
Andy Liu
專案管理力 Project management for youth
專案管理力 Project management for youth
Yung-Chuan Ko
極限編程XP
極限編程XP
Po Chung Wang
Why Scrum (敏捷式專案管理)
Why Scrum (敏捷式專案管理)
Yu Wei Shang
敏捷软件开发——一个实践者的思考V1.2
敏捷软件开发——一个实践者的思考V1.2
Zhang Yongji
敏捷開發分享
敏捷開發分享
東城 楊
專案管理理論基礎
專案管理理論基礎
黑狗 大
高绩效项目团队漫谈
高绩效项目团队漫谈
Lu Ming
Scrum 開發流程導入經驗分享
Scrum 開發流程導入經驗分享
謝 宗穎
Critical Chain
Critical Chain
i_Ashima
银弹!银弹! 徐毅@Italk salon 2011
银弹!银弹! 徐毅@Italk salon 2011
Yi Xu
2012/05/23 AU Talk - 讓事情發生
2012/05/23 AU Talk - 讓事情發生
appuniverz
0721政策議題時間軸
0721政策議題時間軸
Pei-Yi Hsieh
PDCA知行合一2.0: The Nature Of Agile Scrum
PDCA知行合一2.0: The Nature Of Agile Scrum
GlenWang
培训与发展
培训与发展
20004
培训与发展
培训与发展
20004
員工觀點 生產與作業管理
員工觀點 生產與作業管理
tarshar
員工觀點 生產與作業管理
員工觀點 生產與作業管理
Ching Chuang 羅
員工觀點_生產與作業管理
員工觀點_生產與作業管理
Ching Chuang 羅
員工觀點 生產與作業管理
員工觀點 生產與作業管理
tarshar
員工觀點_生產與作業管理
員工觀點_生產與作業管理
Ching Chuang 羅
06.教育訓練與發展
06.教育訓練與發展
Spring Wang
Scrum Agile Development
Scrum Agile Development
Schubert Zhang
Contenu connexe
Tendances
專案管理力 Project management for youth
專案管理力 Project management for youth
Yung-Chuan Ko
極限編程XP
極限編程XP
Po Chung Wang
Why Scrum (敏捷式專案管理)
Why Scrum (敏捷式專案管理)
Yu Wei Shang
敏捷软件开发——一个实践者的思考V1.2
敏捷软件开发——一个实践者的思考V1.2
Zhang Yongji
敏捷開發分享
敏捷開發分享
東城 楊
專案管理理論基礎
專案管理理論基礎
黑狗 大
高绩效项目团队漫谈
高绩效项目团队漫谈
Lu Ming
Scrum 開發流程導入經驗分享
Scrum 開發流程導入經驗分享
謝 宗穎
Critical Chain
Critical Chain
i_Ashima
银弹!银弹! 徐毅@Italk salon 2011
银弹!银弹! 徐毅@Italk salon 2011
Yi Xu
2012/05/23 AU Talk - 讓事情發生
2012/05/23 AU Talk - 讓事情發生
appuniverz
0721政策議題時間軸
0721政策議題時間軸
Pei-Yi Hsieh
PDCA知行合一2.0: The Nature Of Agile Scrum
PDCA知行合一2.0: The Nature Of Agile Scrum
GlenWang
Tendances
(13)
專案管理力 Project management for youth
專案管理力 Project management for youth
極限編程XP
極限編程XP
Why Scrum (敏捷式專案管理)
Why Scrum (敏捷式專案管理)
敏捷软件开发——一个实践者的思考V1.2
敏捷软件开发——一个实践者的思考V1.2
敏捷開發分享
敏捷開發分享
專案管理理論基礎
專案管理理論基礎
高绩效项目团队漫谈
高绩效项目团队漫谈
Scrum 開發流程導入經驗分享
Scrum 開發流程導入經驗分享
Critical Chain
Critical Chain
银弹!银弹! 徐毅@Italk salon 2011
银弹!银弹! 徐毅@Italk salon 2011
2012/05/23 AU Talk - 讓事情發生
2012/05/23 AU Talk - 讓事情發生
0721政策議題時間軸
0721政策議題時間軸
PDCA知行合一2.0: The Nature Of Agile Scrum
PDCA知行合一2.0: The Nature Of Agile Scrum
Similaire à SRE CH28 - Accelerating SREs to On-Call and Beyond
培训与发展
培训与发展
20004
培训与发展
培训与发展
20004
員工觀點 生產與作業管理
員工觀點 生產與作業管理
tarshar
員工觀點 生產與作業管理
員工觀點 生產與作業管理
Ching Chuang 羅
員工觀點_生產與作業管理
員工觀點_生產與作業管理
Ching Chuang 羅
員工觀點 生產與作業管理
員工觀點 生產與作業管理
tarshar
員工觀點_生產與作業管理
員工觀點_生產與作業管理
Ching Chuang 羅
06.教育訓練與發展
06.教育訓練與發展
Spring Wang
Scrum Agile Development
Scrum Agile Development
Schubert Zhang
從 Scrum 到 Kanban: 為什麼 Scrum 不適合 Lean Startup
從 Scrum 到 Kanban: 為什麼 Scrum 不適合 Lean Startup
Wen-Tien Chang
關鍵職能識別、展開與分級經驗分享
關鍵職能識別、展開與分級經驗分享
Lee CHIU
Slide lecture4
Slide lecture4
DLAE2014
交點台北Vol.11 - David Kuo - The 0 Step
交點台北Vol.11 - David Kuo - The 0 Step
交點
品格教育的理念與實踐960517
品格教育的理念與實踐960517
旭壯 羅
專家老師數位教材PPT製作 for 講述法與工作坊(2021數位轉型即戰力線上工作坊)— 20210615
專家老師數位教材PPT製作 for 講述法與工作坊(2021數位轉型即戰力線上工作坊)— 20210615
張大明 Ta-Ming Chang
组织发展与个人发展
组织发展与个人发展
Yanjun Song
Discover agile(agile tour)-owen chen-iji
Discover agile(agile tour)-owen chen-iji
Odd-e
複製 James' speech at tespa & eta esp session
複製 James' speech at tespa & eta esp session
jm11290
培训项目整体解决方案(知行堂)【zxt123.com】
培训项目整体解决方案(知行堂)【zxt123.com】
知行堂(zxt123.com)
QM-060-問題分析與解決能力提升
QM-060-問題分析與解決能力提升
handbook
Similaire à SRE CH28 - Accelerating SREs to On-Call and Beyond
(20)
培训与发展
培训与发展
培训与发展
培训与发展
員工觀點 生產與作業管理
員工觀點 生產與作業管理
員工觀點 生產與作業管理
員工觀點 生產與作業管理
員工觀點_生產與作業管理
員工觀點_生產與作業管理
員工觀點 生產與作業管理
員工觀點 生產與作業管理
員工觀點_生產與作業管理
員工觀點_生產與作業管理
06.教育訓練與發展
06.教育訓練與發展
Scrum Agile Development
Scrum Agile Development
從 Scrum 到 Kanban: 為什麼 Scrum 不適合 Lean Startup
從 Scrum 到 Kanban: 為什麼 Scrum 不適合 Lean Startup
關鍵職能識別、展開與分級經驗分享
關鍵職能識別、展開與分級經驗分享
Slide lecture4
Slide lecture4
交點台北Vol.11 - David Kuo - The 0 Step
交點台北Vol.11 - David Kuo - The 0 Step
品格教育的理念與實踐960517
品格教育的理念與實踐960517
專家老師數位教材PPT製作 for 講述法與工作坊(2021數位轉型即戰力線上工作坊)— 20210615
專家老師數位教材PPT製作 for 講述法與工作坊(2021數位轉型即戰力線上工作坊)— 20210615
组织发展与个人发展
组织发展与个人发展
Discover agile(agile tour)-owen chen-iji
Discover agile(agile tour)-owen chen-iji
複製 James' speech at tespa & eta esp session
複製 James' speech at tespa & eta esp session
培训项目整体解决方案(知行堂)【zxt123.com】
培训项目整体解决方案(知行堂)【zxt123.com】
QM-060-問題分析與解決能力提升
QM-060-問題分析與解決能力提升
Plus de Rick Hwang
在生命轉彎的地方 - 從軟體開發職涯,探索人生
在生命轉彎的地方 - 從軟體開發職涯,探索人生
Rick Hwang
20230829 - 探索職涯,複利人生
20230829 - 探索職涯,複利人生
Rick Hwang
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
Rick Hwang
20230215 - 凝聚團隊共識的溝通方法 (Effective Team Communication)
20230215 - 凝聚團隊共識的溝通方法 (Effective Team Communication)
Rick Hwang
軟體測試實務新書發表會 - 從品質與測試,讓軟體再次偉大
軟體測試實務新書發表會 - 從品質與測試,讓軟體再次偉大
Rick Hwang
CH02 API Governance
CH02 API Governance
Rick Hwang
Chapter 8. Partial updates and retrievals.pdf
Chapter 8. Partial updates and retrievals.pdf
Rick Hwang
Ch09 Custom Methods
Ch09 Custom Methods
Rick Hwang
AWS Career Exploration Day
AWS Career Exploration Day
Rick Hwang
從理想、到現實的距離,開啟品味軟體測試之路 - 台灣軟體工程協會 (20220813)
從理想、到現實的距離,開啟品味軟體測試之路 - 台灣軟體工程協會 (20220813)
Rick Hwang
SRE Conf 2022 - 91APP 在 AWS 上的 SRE 實踐之路
SRE Conf 2022 - 91APP 在 AWS 上的 SRE 實踐之路
Rick Hwang
導讀持續交付 2.0 - CH02 價值探索環
導讀持續交付 2.0 - CH02 價值探索環
Rick Hwang
2020 AWS Summit - 如何有效管理 AWS 的成本結構與系統架構
2020 AWS Summit - 如何有效管理 AWS 的成本結構與系統架構
Rick Hwang
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
Rick Hwang
Software Development Process v1.5 - 20121214
Software Development Process v1.5 - 20121214
Rick Hwang
第三章 建立良好的人際關係網路
第三章 建立良好的人際關係網路
Rick Hwang
Wiki in Teamroom - Connected Mind
Wiki in Teamroom - Connected Mind
Rick Hwang
導讀持續交付 2.0 - 談當代軟體交付之虛實融合
導讀持續交付 2.0 - 談當代軟體交付之虛實融合
Rick Hwang
Study Notes - Event-Driven Data Management for Microservices
Study Notes - Event-Driven Data Management for Microservices
Rick Hwang
Study Notes - Using an API Gateway
Study Notes - Using an API Gateway
Rick Hwang
Plus de Rick Hwang
(20)
在生命轉彎的地方 - 從軟體開發職涯,探索人生
在生命轉彎的地方 - 從軟體開發職涯,探索人生
20230829 - 探索職涯,複利人生
20230829 - 探索職涯,複利人生
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
20230215 - 凝聚團隊共識的溝通方法 (Effective Team Communication)
20230215 - 凝聚團隊共識的溝通方法 (Effective Team Communication)
軟體測試實務新書發表會 - 從品質與測試,讓軟體再次偉大
軟體測試實務新書發表會 - 從品質與測試,讓軟體再次偉大
CH02 API Governance
CH02 API Governance
Chapter 8. Partial updates and retrievals.pdf
Chapter 8. Partial updates and retrievals.pdf
Ch09 Custom Methods
Ch09 Custom Methods
AWS Career Exploration Day
AWS Career Exploration Day
從理想、到現實的距離,開啟品味軟體測試之路 - 台灣軟體工程協會 (20220813)
從理想、到現實的距離,開啟品味軟體測試之路 - 台灣軟體工程協會 (20220813)
SRE Conf 2022 - 91APP 在 AWS 上的 SRE 實踐之路
SRE Conf 2022 - 91APP 在 AWS 上的 SRE 實踐之路
導讀持續交付 2.0 - CH02 價值探索環
導讀持續交付 2.0 - CH02 價值探索環
2020 AWS Summit - 如何有效管理 AWS 的成本結構與系統架構
2020 AWS Summit - 如何有效管理 AWS 的成本結構與系統架構
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
Software Development Process v1.5 - 20121214
Software Development Process v1.5 - 20121214
第三章 建立良好的人際關係網路
第三章 建立良好的人際關係網路
Wiki in Teamroom - Connected Mind
Wiki in Teamroom - Connected Mind
導讀持續交付 2.0 - 談當代軟體交付之虛實融合
導讀持續交付 2.0 - 談當代軟體交付之虛實融合
Study Notes - Event-Driven Data Management for Microservices
Study Notes - Event-Driven Data Management for Microservices
Study Notes - Using an API Gateway
Study Notes - Using an API Gateway
SRE CH28 - Accelerating SREs to On-Call and Beyond
1.
1
2.
Authors: Andrew Widdowson P371
- P385, 14 (繁中版) Chapter 28 Accelerating SREs to On-Call and Beyond 迅速培養 SRE 加入 On-Call 2
3.
3 https://www.linkedin.com/in/andrewwiddowson/
4.
Agenda ● SRE 新手報到,接下來怎麼辦 ●
培訓初期:重系統,而非混亂 ● 培養逆向工程和隨機應變能力 ● 有抱負的 On-Call 工程師的五項特質 ● On-Call 之後:舉辦結業儀式,及日後持續教育 4
5.
5
6.
Agenda ● SRE 新手報到,接下來怎麼辦 ●
培訓初期:重系統,而非混亂 ● 培養逆向工程和隨機應變能力 ● 有抱負的 On-Call 工程師的五項特質 ● On-Call 之後:舉辦結業儀式,及日後持續教育 6
7.
推薦的訓練方式 錯誤的訓練方式 設計一門具體,有延續性的學習體驗,以便學員跟進 透過給學員安排一些繁瑣的工作,像是處理報警工單 鼓勵逆向工程,利用統計學思考問題,以及多思考問題本質
訓練學員按照現有的操作流程、檢核表,或者手冊執行命令 鼓勵學員分析失敗案例,分享好的事後檢討 將故障掩蓋起來,以便躲避指責 創造受控,但是逼真的情境,讓學員利用真實監控環境和工具來修復 在學員加入 On-Call 之後,第一次遇到問題時才會嘗試修復 在團隊內以角色扮演形式,演練理論上可能發生的問題,讓大家在過程 中分享解決問題的方法 在團隊中將知識隔離起來,創造出特定領域專家 為學員創造條件,讓他們見習On-Call,和實際輪值的 On-Call 交流經 驗 在學員還沒有對服務有全面認識的情況下,就要求他們成為主On-Call 讓學員和 SRE 老手一起制定培訓計劃中的某個項目 認為 On-Call 訓練素材是靜態的,非專家不可更改 讓學員一起參與具有一定複雜度的專案,幫助他們在整個技術堆疊內奠 定自己的地位 將新專案全部分配給老手,新手只能做零工 SRE 訓練課程 7
8.
8 抽象 具體 資淺 資深
9.
9 SRE 新手報到,接下來怎麼辦? ● 正式參加
On-Call 是新成員的重要里程碑 ● 專案工作與責任感 ● 活動類型 ○ 抽象的、被動的 ○ 具象的、主動的 ○ 混合形的 ● 培訓應該是持續不斷學習,資深、資淺都要參加
10.
10
11.
Agenda ● SRE 新手報到,接下來怎麼辦 ●
培訓初期:重系統,而非混亂 ● 培養逆向工程和隨機應變能力 ● 有抱負的 On-Call 工程師的五項特質 ● On-Call 之後:舉辦結業儀式,及日後持續教育 11
12.
SRE 職責類型 ● 主動性任務:軟體自動化、架構設計諮詢、發行流程協調 ●
被動性任務:線上調校、故障排除、處理 On-Call 事件 12
13.
浴火重生的學習方式 13
14.
系統性、累積型的學習方式 在系統中,加入順序性,讓新手建立學習路徑 1. 請求是如何進入系統 2. 前端服務:應用程式前端、日誌記錄、使用者體驗
SLO 3. 中層服務:快取、後端負載平衡 4. 基礎設施:後端、基礎設施、運算資源 5. 整體:調教的技巧、問題升級流程、警急情況演練 14
15.
15
16.
Agenda ● SRE 新手報到,接下來怎麼辦 ●
培訓初期:重系統,而非混亂 ● 培養逆向工程和隨機應變能力 ● 有抱負的 On-Call 工程師的五項特質 ● On-Call 之後:舉辦結業儀式,及日後持續教育 16
17.
逆向工程:弄明白系統如何工作 ● 了解系統的基本工作原理 ● 深入研究調校工具 ●
了解系統的資料流動方向性 17
18.
統計學和比較性思維:在壓力下堅持科學方法 ● 警及異常中,能夠即時展開決策樹 ● 在有效的時間之內,在決策樹中抉擇 ●
架構層面:要確認可以控制的因子,比較分析每個因子,新人一開始就要訓練 18
19.
隨機應變的能力:當意料之外的事情發生時怎麼辦 ● 依照手冊無法修復問題,又無法聯繫開發人員 ● 透過訓練課程,養成思考,加入決策陷阱,培養抽象思考能力 19
20.
將知識串連起來 ● Google 內部最受歡迎的課:如何逆向工程每個正式作業環境服務 ●
SRE 學習 Google Maps 服務一部分的時候,與其讓其他人傳授知識給他,不如 自己動手,逆向工程去了解,讓其他人糾正他的錯誤和補充遺漏部份。 ○ 獨立思考、組織能力 ○ 想像力、聯想力 ○ 抽象化 20 分享文:思考本質、實踐、想像力、哲學
21.
21
22.
Agenda ● SRE 新手報到,接下來怎麼辦 ●
培訓初期:重系統,而非混亂 ● 培養逆向工程和隨機應變能力 ● 有抱負的 On-Call 工程師的五項特質 ● On-Call 之後:舉辦結業儀式,及日後持續教育 22
23.
● 對故事的渴望:事後檢討的閱讀和撰寫 ○ 無法記取的教訓,必然重蹈覆徹 ○
對事不對人 ○ 事後檢討會、故障沙龍 ● 故障處理分角色演練 ○ 每週會議上,指定某個成員 A 來現場處理某個故障情境 ○ 就像參加電視娛樂節目,A 要跟主持人提出問題,主持人告訴行動結果 ○ 給予活動命型:厄運之輪 (Wheel of Misfortune)、走條木 (Walk the Plank) 五項特質 23
24.
角色扮演 - Mud 24
25.
五項特質 25 ● 破壞真系統並且修復他們 ○ Chaos
Engineering: Chaso Monkey ○ 要有完整且真實的 QA 環境,作為訓練使用 ○ 練習活動:『一起來摧毀一組搜尋叢集』 ● 文件維護是學徒任務的一部分 ○ 學員:了解維運的範圍、運作原理 ○ 教練、管理者:透過檢核表反應學員學習進度、不了解的地方 ○ 其他團隊:文件是社交契約 ● 儘早、盡快見習 On-Call ○ 見習 (Shadow) 是培養學員進度的好機會 ○ 促進團隊相互了解、信任 ○ 重大異常時,事後檢討應該由全部 On-Call 一起完成,讓新手參與
26.
● 加入 On-Call
之後表示: ○ 了解技術堆疊、有自主學習能力 ○ 期末測驗 ○ 賦予學員 On-Call 權限和責任 ○ 里程碑,要有儀式 ● 持續學習 ○ 新架構 ○ 新技術堆疊 ○ 避免知識過期 On-Call 之後:結業儀式 26
27.
27
28.
小結 ● 教育訓練是很有價值的,不管是對新手,還是整個團隊 ● 比擴張機器更快的速度擴張團隊 28
29.
29
Télécharger maintenant