停機前後的流量轉移

作者:   發佈於:   #outage #traffic

Cloudflare 在 Facebook DNS 停擺的這段期間所做的觀察(*1)讀來十分有意思,主要耐人尋味的是以下這段:他們自家 DNS 1.1.1.1 查詢量在 Facebook 停擺期間增長 30 倍。

So now, because Facebook and their sites are so big, we have DNS resolvers worldwide handling 30x more queries than usual and potentially causing latency and timeout issues to other platforms.

以前在自己參與的專案裡,也曾在自家監控系統上看到這種關於流量消長的類似現象。大致上可描述為:在系統部分停擺的時候,整體收到的總查詢量會比以往更多。

一般認定為是使用者在面對錯誤畫面時,必定會重試好幾次,甚至換條路重試,手機 app 開不了改開網站之類的。而這反覆重試的過程也會給系統某處帶來一些查詢量。

如果把整個 Internet 視為一個系統,那麼這次 1.1.1.1 顯然就是 Facebook DNS 的代償之一了。

關於這次 Facebook 停機,還有幾則類似的報告。

過去幾年間也有類似報告:

Pornhub insight 超愛報告自家流量​的好消息,不過其分析的過程的確值得參考。

雖然這些報告大部分都是片面的,但也呈現出平常時 Facebook / YouTube 的確吃了總體網路流量很大一部分的這件事實。在這兩站停擺時,天下所有網站都是其代償​。

我猜測在停機結束之後會湧入一波瞬間飆高的流量,但 Facebook 自家提供的停機細節報告倒是沒有任何數字可以參考,所以這個猜測就無法被確認了。