Một báo cáo độc lập về sự cố gián đoạn hoạt động của Rogers năm 2022 cho biết công ty thiếu một số biện pháp bảo vệ và dự phòng có thể ngăn chặn hoặc chấm dứt tình trạng gián đoạn hoạt động sớm hơn.
Báo cáo gửi tới Ủy ban Viễn thông và Phát thanh-Truyền hình Canada cho biết kể từ khi ngừng hoạt động, công ty viễn thông đã thực hiện các thay đổi cần thiết để giải quyết nguyên nhân ngừng hoạt động và cải thiện khả năng phục hồi và độ tin cậy của mạng.
Trong một lá thư riêng được đăng lên trang web của mình hôm thứ Năm, CRTC xác nhận rằng Rogers cũng đã thực hiện tất cả các khuyến nghị bổ sung của báo cáo.
Người phát ngôn của Rogers, Sarah Schmidt, cho biết: “Chúng tôi đã nói rằng chúng tôi sẽ khắc phục điều này – chúng tôi đã hoàn thành đánh giá đầy đủ các mạng của mình, tăng cường khả năng phục hồi của mạng, thực hiện tất cả các đề xuất trong báo cáo và ngày nay mạng của chúng tôi được các nhà lãnh đạo đo điểm chuẩn toàn cầu công nhận là đáng tin cậy nhất.”
Vụ gián đoạn diện rộng vào sáng sớm ngày 8/7 cách đây hai năm kéo dài hơn 24 giờ và ảnh hưởng đến hơn 12 triệu khách hàng.
Theo bản tóm tắt báo cáo của Xona Partners Inc. được đăng trực tuyến, một lỗi cấu hình trong quá trình nâng cấp mạng đã gây ra một lượng lớn dữ liệu đến các bộ định tuyến mạng lõi, khiến các bộ định tuyến mạng lõi bị lỗi.
Báo cáo cho biết sự cố mạng có thể được ngăn chặn nếu các bộ định tuyến mạng lõi được cấu hình với giới hạn quá tải.
Sau khi xảy ra tình trạng gián đoạn, báo cáo cho biết thời gian ngừng hoạt động đã bị kéo dài bởi một số yếu tố.
Báo cáo cho biết trung tâm điều hành mạng Rogers và các cơ sở hạ tầng từ xa quan trọng khác không có kết nối dự phòng từ các nhà cung cấp dịch vụ khác, hạn chế quyền truy cập vào các thiết bị quan trọng trong thời gian ngừng hoạt động. Nhân viên phải được cử đến các địa điểm ở xa để truy cập vào các bộ định tuyến bị ảnh hưởng, làm trì hoãn các nỗ lực khôi phục.
Ngoài ra, nhân viên của Rogers cũng không có kết nối dự phòng từ các nhà cung cấp dịch vụ thay thế và vì vậy họ không thể liên lạc với nhau cho đến khi công ty gửi thẻ SIM từ các nhà cung cấp dịch vụ khác đến các địa điểm ở xa.
Báo cáo cho biết ban đầu nhân viên cũng không có quyền truy cập vào thông tin như nhật ký lỗi của bộ định tuyến và không thể xác định nguyên nhân gốc rễ của việc ngừng hoạt động trong khoảng 14 giờ. Cũng có nhiều thay đổi về cấu hình được thực hiện vào ngày hôm đó. Báo cáo cho biết, hai yếu tố này đã góp phần khiến nguyên nhân gốc rễ ban đầu bị chẩn đoán sai.
Báo cáo cho biết các biện pháp mà Rogers thực hiện kể từ khi ngừng hoạt động bao gồm giải quyết các thiếu sót nghiêm trọng do ngừng hoạt động, tách lõi IP cho mạng không dây và mạng có dây, đồng thời cải thiện quy trình quản lý thay đổi và quản lý sự cố.
Báo cáo đưa ra bảy khuyến nghị về các biện pháp bổ sung mà Rogers có thể thực hiện để cải thiện khả năng phục hồi mạng của mình.
Trong số các khuyến nghị mà Rogers đã thực hiện kể từ đó, công ty nên thử nghiệm chuyển vùng khẩn cấp với các nhà khai thác mạng di động khác, phát triển bản phân tích nguyên nhân cốt lõi chi tiết về các lần ngừng hoạt động trong tương lai và mở rộng phạm vi diễn tập quản lý sự cố.
Rogers đã gửi một lá thư cho CRTC vào ngày 17 tháng 1 nêu rõ cách họ phản ứng với các khuyến nghị của báo cáo về các biện pháp bổ sung.
Trong thư của CRTC xác nhận các biện pháp bổ sung đó đã được thực hiện, ủy ban cho biết trước ngày 4 tháng 7 năm sau, Rogers phải báo cáo xem liệu các biện pháp này có tiếp tục giải quyết các vấn đề về độ tin cậy hay không cũng như tiến độ đạt được trong việc tách các mạng lõi có dây và không dây.
Schmidt cho biết Rogers đang hợp tác với Cisco trong công việc phân chia và xây dựng lõi IP chuyên dụng mới, tách biệt hai mạng. Cô cho biết công ty cũng đã giới thiệu các biện pháp kiểm soát thay đổi mới nhằm hạn chế tác động của “các sự kiện tác động đến khách hàng”, cũng như “khả năng mô phỏng dự đoán dựa trên AI để tăng cường thử nghiệm và giám sát của chúng tôi.”
Báo cáo cũng bao gồm các khuyến nghị dành cho tất cả các nhà khai thác mạng viễn thông dựa trên “những bài học quan trọng rút ra” từ sự cố ngừng hoạt động. Chúng bao gồm việc triển khai bảo vệ quá tải bộ định tuyến trong lõi IP và mạng phân phối; cung cấp kết nối dự phòng cho trung tâm điều hành mạng, các địa điểm quan trọng từ xa và nhân viên quan trọng; và mô phỏng các tình huống lỗi và ngừng hoạt động của mạng để phát hiện ra những thiếu sót.
© 2024 The Canadian Press
Bản tiếng Việt của The Canada Life