Minor Mistake, Major Catastrophe - GitLab ไปออฟไลน์เป็นเวลาหนึ่งวัน
GitLab การเริ่มต้นที่เป็นทางเลือกแทน GitHub ที่ได้รับความนิยมสูงมีวันที่ค่อนข้างหยาบเมื่อเร็ว ๆ นี้ ข้อผิดพลาดของมนุษย์ทำให้เว็บไซต์ทั้งหมดหยุดทำงานเต็มวัน.
ปัญหาของ GitLab เริ่มขึ้นเมื่อ เว็บไซต์กำลังประสบปัญหาความเร็วในการโหลดและปัญหาความเสถียร. เว็บไซต์ถูกออฟไลน์เพื่อแก้ไขปัญหา อย่างไรก็ตามในระหว่างการบำรุงรักษา, มีบางคนทำผิดพลาดโดยไม่ตั้งใจจากการลบไดเรกทอรีที่มีข้อมูลการผลิตจริง 300GB โดยไม่ได้ตั้งใจ.
โชคดีสำหรับ GitLab เนื้อหาที่ถูกลบเท่านั้น ปัญหาที่ได้รับผลกระทบและคำขอที่รวมเข้าด้วยกัน. ที่เก็บและวิกิไม่ได้รับผลกระทบจากความผิดพลาดนี้ แต่อย่างใดซึ่งหมายความว่า ความเสียหายที่เกิดจากความผิดพลาดนี้ไม่รุนแรง อย่างที่ควรจะเป็น
เมื่อลบไดเรกทอรีแล้วบุคลากรของ GitLab จะหันไปใช้การสำรองข้อมูลทันที น่าเสียดายสำหรับพวกเขา GitLab พบกัน อีกปัญหาหนึ่ง. ตามไฟล์ Google Doc ที่อัปเดตอยู่ตลอดเวลาเนื่องจาก GitLab พยายามกลับมาออนไลน์การสำรอง / จำลองทั้งหมด 5 ครั้ง เทคนิคที่เว็บไซต์ปรับใช้ไม่สามารถทำงานได้อย่างน่าเชื่อถือ, และในบางกรณี ไม่เคยตั้งค่าในสถานที่แรก.
การดึงไฟล์ที่หายไปจากคลาวด์ ไม่ใช่ตัวเลือกสำหรับ GitLab เนื่องจากการเริ่มต้นตัดสินใจเมื่อปลายปีที่แล้ว ถ่ายโอนคลาวด์เพื่อสร้างและใช้งาน Ceph clusters ของตัวเองแทน. ไม่จำเป็นต้องพูด GitLab กำลังพิจารณาจุดยืนของตนในหัวข้อนั้นอีกครั้ง.
@TheRegister @gitlab จะทำงานเพื่อให้แอปพลิเคชั่นมีประสิทธิภาพมากขึ้นและสำรวจผู้ให้บริการโฮสติ้งคลาวด์ทางเลือก.
- Connor Shea (@connorjshea) 1 กุมภาพันธ์ 2017
แม้จะมีวันที่สับสนวุ่นวายที่ GitLab เคยมีมา แต่ตอนนี้เว็บไซต์ก็เปิดให้บริการตามปกติ ในขณะที่เว็บไซต์ รายงานว่าข้อมูลบางส่วนสูญหายระหว่างช่วงเวลาหกชั่วโมง, the Git ที่เก็บถูกทิ้งไว้ไม่เป็นอันตราย ตลอดการทดสอบทั้งหมด บันทึกเหตุการณ์ทั้งหมดของเหตุการณ์ทั้งหมดสามารถดูได้ที่นี่.
ในขณะที่หลาย ๆ สามารถเรียนรู้บทเรียนได้จากความผิดพลาดเล็กน้อยของ GitLab (ส่วนใหญ่เป็นความโอหัง) วิธีการของ GitLab ในการจัดการกับวิกฤตนั้นค่อนข้างน่าชื่นชมเช่นกัน การเริ่มต้นนั้นชัดเจนและโปร่งใสกับผู้ใช้. นี่คือความหวังที่ GitLab เรียนรู้จากความผิดพลาดนี้ มิฉะนั้นฐานผู้ใช้อาจจะให้อภัยน้อยลงหากประวัติซ้ำตัวเอง.
ที่มา: การลงทะเบียน