Vào sáng thứ Ba (8/6), lúc khoảng 10h50 sáng theo giờ BST và 5h50 sáng theo giờ ET, một loạt các trang web đình đám đã không thể truy cập trong khoảng một giờ. Chúng bao gồm Reddit, Amazon, Twitch, CNN, The New York Times, BBC, PayPal, HBO Max, Hulu, PayPal, và thậm chí cả trang web của chính phủ Vương quốc Anh.
Tất cả chúng chỉ có một điểm chung duy nhất là sử dụng dịch vụ của Fastly, một nhà cung cấp mạng phân phối nội dung (CDN).
Có thể bạn chưa nghe nói về Fastly, nhưng bạn có thể đã và đang tương tác với nó theo một cách nào đó mỗi khi lên mạng. Cùng với Cloudflare và Akamai, chúng là ba nhà cung cấp CDN lớn nhất trên thế giới. Và trong khi chính Fastly vẫn đang mơ hồ về sự cố nào đã gây ra tình hình gián đoạn trên toàn thế giới, thì sự việc cũng đưa ra một lời nhắc nhở rõ ràng về việc cơ sở hạ tầng internet của chúng ta được kết nối với nhau và mong manh như thế nào, đặc biệt là khi phần lớn nó phụ thuộc vào quy trình hoạt động của một số công ty vẫn đang nằm ngoài nhận thức của cộng đồng.
Món "hàng" đặc biệt
Để hiểu một cách đơn giản về vai trò và tầm quan trọng của Fastly, hãy cùng dành một phút tìm hiểu về vai trò của CDN trong hệ sinh thái Internet. Mặc dù nhiều người vẫn coi Internet là vô định hình, nhưng các bài báo mà bạn đọc, phim và bài hát bạn đang phát trực tuyến, ảnh bạn đăng, tất cả chúng đều nằm trên các máy chủ vật lý. Và mặc dù nội dung đó có thể chủ yếu được lưu trữ trên một nhà cung cấp dịch vụ đám mây, nhưng vẫn cần một cách để đưa nó đến với mọi người một cách nhanh chóng và hiệu quả.
Đó là nơi CDN xuất hiện. Bằng cách vận hành các máy chủ trên toàn cầu, CDN có thể thu hẹp khoảng cách giữa điện thoại thông minh của bạn và trải nghiệm Internet mà bạn lựa chọn. Hãy coi nó giống như việc một quả bóng di chuyển ra sao trong môn bóng chày: Thay vì cố gắng ném quả bóng về sân nhà của chính mình, một cầu thủ sẽ ném nó cho một đồng đội và người này sẽ ném nó cho người bắt bóng. Việc này nhanh hơn và hiệu quả hơn ném thẳng quả bóng về sâu nhà.
"Về cơ bản, CDN mang lại hiệu suất thực sự cao cho nội dung, cho dù đó là video phát trực tuyến hoặc một trang web, hoặc tất cả những hình ảnh nhỏ xuất hiện khi bạn truy cập vào một trang thương mại điện tử", Angelique Medina, giám đốc tiếp thị sản phẩm của công ty giám sát mạng ThousandEyes cho biết. "Nó cho phép người dùng giảm bớt rất nhiều thời gian tải trang và cũng cho phép mọi người có trải nghiệm thực sự tuyệt vời khi họ đang lướt web".
Lấy ví dụ như bài báo mà bạn đang đọc này, ngay bây giờ. Rất có thể thứ bạn đang đọc là một bản sao của nó, được lưu trong bộ nhớ cache của thứ được gọi là "điểm hiện diện" (POP), hay một máy chủ ở đâu đó trong khu vực bạn đang sống. Bản đồ mạng lưới Fastly chỉ ra rằng công ty này vận hành POP ở ít nhất 58 thành phố trên khắp thế giới, bao gồm nhiều thành phố ở các khu vực đông dân cư như Los Angeles, London và Singapore. Nó liệt kê công suất toàn cầu kết hợp ở mức khổng lồ là 130 terabits mỗi giây.
Và đó không phải là tất cả! CDN không chỉ lưu trữ nội dung gần hơn với các thiết bị mong muốn nó. Công ty này cũng giúp định hướng chúng trên Internet.
"Nó giống như điều phối luồng giao thông trên một hệ thống đường lớn", Ramesh Sitaraman, một nhà khoa học máy tính tại Đại học Massachusetts ở Amherst, người đã giúp tạo ra CDN lớn đầu tiên với tư cách là một kiến trúc sư nguyên tắc tại công ty Akamai cho biết. "Nếu một số liên kết trên Internet bị lỗi hoặc bị tắc nghẽn, các thuật toán CDN sẽ nhanh chóng tìm ra một tuyến đường thay thế đến đích".
Vì vậy, khi một CDN gặp sự cố, nó có thể kéo theo nhiều phần của Internet đi cùng.
Độc quyền CDN
"Chúng tôi đã xác định cấu hình dịch vụ gây ra gián đoạn trên các POP của chúng tôi trên toàn cầu và đã vô hiệu hóa cấu hình đó", người phát ngôn của Fastly cho biết trong một tuyên bố. "Mạng toàn cầu của chúng tôi sẽ trực tuyến trở lại".
Một lần nữa, không rõ chính xác điều gì đã xảy ra tại Fastly. Khái niệm "cấu hình dịch vụ" có thể có nghĩa là bất kỳ thứ gì, nhưng có một điều chắc chắn duy nhất là bất kể nguyên nhân gốc rễ ra sao thì nó đều có tác động trên phạm vi rộng. Theo trang báo cáo sự cố của Fastly, mọi lục địa trên toàn cầu, ngoài Nam Cực, đều cảm nhận thấy tác động của sự cố.
Và ngay cả sau khi Fastly đã khắc phục sự cố về cơ bản, công ty cũng cảnh báo rằng người dùng vẫn có thể thấy "tỷ lệ truy cập bộ nhớ cache" thấp hơn - tần suất bạn có thể tìm thấy nội dung mình cần đã được lưu trữ trong một máy chủ lân cận - và "tải gốc tăng lên", khái niệm đề cập tới quá trình quay trở lại nguồn đối với các mục không có trong bộ nhớ cache.
Các CDN về cơ bản thường được thiết kế để chống lại các điều kiện khắc nghiệt và sự cố không mong muốn. Nếu một máy chủ bị lỗi, các máy chủ khác có thể tiếp nhận tải. Nếu toàn bộ trung tâm dữ liệu bị lỗi, áp lực truyền tải có thể được chuyển sang các trung tâm dữ liệu khác. Nếu mọi thứ hoạt động hoàn hảo, thì khi sự cố xảy ra, các cơ chế phục hồi của CDN sẽ đảm bảo rằng người dùng gần như không bao giờ nhận ra điều gì bất thường.
Nhưng khi có gì đó xảy ra, nó thường liên quan đến lỗi phần mềm hoặc lỗi cấu hình được đẩy đến nhiều máy chủ cùng một lúc, theo Sitaraman.
Ngay cả khi đó, các trang web và dịch vụ sử dụng CDN thường có các biện pháp dự phòng của riêng mình. Ví dụ như gã khổng lồ Amazon, chỉ mất khoảng 20 phút để thiết lập và chạy trở lại, vì nó có thể chuyển hướng lưu lượng truy cập sang các nhà cung cấp CDN khác. Nhưng với những người chỉ dựa vào Fastly hoặc không có hệ thống tự động để xử lý sự cố, họ đều phải chờ đợi.
Roland Dobbins, kỹ sư chính của công ty bảo mật Netscout cho biết: "Việc ngừng hoạt động là kết quả của việc độc quyền". Ông gợi ý rằng mọi tổ chức có sự hiện diện trực tuyến đáng kể trên Internet nên có nhiều nhà cung cấp CDN để tránh loại tình huống này.
Tuy nhiên, các lựa chọn của họ ngày càng bị hạn chế. Bởi cũng giống như việc các hệ thống dữ liệu đám mây phần lớn đã nằm trong tay Amazon, Google và Microsoft, thì ba nhà cung cấp CDN là Cloudflare, Akamai và Fastly đã thống trị luồng nội dung trực tuyến.
"Có rất nhiều người tập trung sử dụng dịch vụ của rất ít nhà cung cấp dịch vụ", Medina nói. "Bất cứ khi nào một trong ba nhà cung cấp đó gặp sự cố, thường đó sẽ không phải là sự cố tồn tại trong thời gian dài, nhưng nó sẽ có tác động lớn trên Internet".
Và theo bà Medina, theo thời gian khi có thêm ngày càng nhiều người phải dựa vào số ít các công ty này, thì khi vấn đề xảy ra, càng nhiều kết nối bị bỏ lỡ và sự cố sẽ càng lớn.
Tham khảo: Wired
Theo Bảo Nam (Pháp Luật & Bạn Đọc)