Indignazione di Cloudflare Indignazione | Ancora più stupidità FAA 5G

Benvenuto a La vista lunga—dove esaminiamo le notizie della settimana e le spogliamo all’essenziale. Alleniamoci ciò che conta davvero.

Questa settimana: Cloudflare subisce un’altra enorme interruzione mentre FAA e FCC ancora in disaccordo su 5G/NR vicino agli aeroporti.

DevOps Connect: DevSecOps @ RSAC 2022

1. Un’altra settimana: un’altra interruzione di Cloudflare

Per prima cosa questa settimana: è stata “solo” un’ora, ma quando così tanti servizi si basano sull’infrastruttura di Cloudflare, sai che ci saranno lamenti e digrignare i denti.

Analisi: se non è DNS, lo è sempre BGP

L’autopsia è arrivata. E rende imbarazzante la lettura di un servizio che mira a migliorare la disponibilità dei propri clienti. Cosa può imparare il tuo team operativo?

Manish Singh: Cloudflare risolve l’interruzione che ha messo offline i servizi più diffusi

Cloudflare ha dichiarato martedì di aver risolto un’interruzione “diffusa” all’inizio della giornata che ha interessato un gran numero di servizi tra cui FTX, Discord, Omegle, DoorDash, Crunchyroll, NordVPN e Feedly. L’azienda di infrastrutture Internet ha risolto il problema circa un’ora dopo che gli utenti hanno iniziato ad affrontare problemi di accesso ad alcuni siti popolari tra cui Zerodha, Medium, [The] Register, Groww, Buffer, iSpirt, Upstox e Social Blade.

Gli utenti avevano anche indicato che stavano lottando per utilizzare Coinbase, Shopify e League of Legends, secondo DownDetector. [Cloudflare] ha affrontato un’interruzione simile in alcune parti del mondo la scorsa settimana.

Tom Strickx e Jeremy Hartman di Cloudflare hanno confessato…Interruzione di Cloudflare:

Cloudflare ha subito un’interruzione che ha interessato il traffico in 19 dei nostri data center. Sfortunatamente, queste 19 località gestiscono una parte significativa del nostro traffico globale. Questa interruzione è stata causata da un cambiamento che faceva parte di un progetto di lunga data … per convertire tutte le nostre sedi più trafficate in un’architettura più flessibile e resiliente … chiamata Multi-Colo PoP (MCP).

Durante la distribuzione di una modifica al nostro [BGP] politiche pubblicitarie dei prefissi, un riordinamento dei termini ci ha indotto a ritirare un sottoinsieme critico di prefissi. A causa di questo ritiro, [we] ha riscontrato una maggiore difficoltà nel raggiungere le località interessate per ripristinare il cambiamento problematico. … Anche se queste posizioni rappresentano solo il 4% della nostra rete totale, l’interruzione ha avuto un impatto sul 50% delle richieste totali. … [It] ha anche fatto sì che il nostro sistema di bilanciamento del carico interno… smettesse di funzionare. … Ciò significava che i nostri cluster di elaborazione più piccoli … ricevevano la stessa quantità di traffico dei nostri cluster più grandi, causando il sovraccarico di quelli più piccoli.

Chiaramente non siamo stati all’altezza delle aspettative dei nostri clienti con questo incidente molto doloroso. … Abbiamo identificato diverse aree di miglioramento e continueremo a lavorare per scoprire eventuali altre lacune … per garantire che ciò non possa accadere di nuovo.

È un problema sistemico in tutto il settore, pensa Jiggawatts:

Il modo predefinito in cui viene gestita la maggior parte dei dispositivi di rete è pazzesco al giorno d’oggi. [It] è qualcosa che ogni amministratore di rete deve implementare su misura dopo aver imparato a proprie spese.

Ho osservato personalmente gli amministratori apportare modifiche al routing in cui qualsiasi errore li avrebbe tagliati fuori dal dispositivo che stanno gestendo e impedito loro di ripristinarlo, più o meno quello che è successo qui. … Molti dispositivi si basano ancora sul “non salvare” la configurazione, con un ciclo di alimentazione come ripristino dello stato salvato precedente. Questo è un ottimo modo per trasformare una piccola interruzione in una grande.

Persone nelle case di vetro, ecc. Ecco Claptrap314:

Mettere a posto queste cose è **** difficile. … Questo incidente è un altro promemoria del fatto che la resilienza si verifica ogni livello della pila.


2. 5G: nuova radio, vecchie regole

A gennaio vi ho parlato del singhiozzo dell’ultimo minuto nella tregua tra FTC e FAA sulle torri 5G/NR vicino agli aeroporti. Come forse ricorderete, la FAA e le compagnie aeree erano preoccupate per l’interferenza tra la banda 5G 77 e gli altimetri radar installati in aerei più vecchi.

Analisi: FCC perde la pazienza

Non c’è sovrapposizione tra la banda 77 e le frequenze assegnate dagli altimetri, anzi, c’è una “banda di guardia” carnosa tra i due. L’argomento della FCC è che gli altimetri che subiscono interferenze non sono stati progettati correttamente in primo luogo, quindi è irragionevole ritardare ulteriormente il lancio del 5G. Quindi la FAA ora chiede alle compagnie aeree di installare filtri per mitigare il rischio di interferenza. La FAA vuole che ciò avvenga entro la fine dell’anno.

Jon Gold: Compagnie di telecomunicazioni, accordo FAA sull’interferenza 5G

Il nuovo equipaggiamento per i vecchi aeroplani è l’ultimo passo avanti nella disputa in corso tra le maggiori compagnie di telecomunicazioni e il [FAA], poiché le autorità di regolamentazione concordano ulteriori misure volte a ridurre i rischi per la sicurezza percepiti causati dal 5G. … Le frequenze utilizzate dai sistemi radioaltimetrici, che sono un’importante caratteristica di sicurezza per gli aerei in atterraggio, sono vicine a quelle utilizzate da alcuni tipi di 5G.

Un accordo … delinea nuovi requisiti per gli operatori … per aggiungere filtri a radiofrequenza ai loro aerei e fissa una scadenza per la fine del 2022. … Le società di telecomunicazioni hanno mitigato la potenziale interferenza riducendo la potenza di trasmissione ai punti di accesso 5G. … Il nuovo accordo vedrà le mitigazioni continuare fino alla fine del 2022.

L’industria aerea, tuttavia, non è rimasta colpita dai termini dell’accordo… citando la mancanza di dettagli tecnici e l’approvazione normativa dei dispositivi altimetro sostitutivi.

Nick Careen, vicepresidente senior per le operazioni, la sicurezza e la protezione della International Air Transport Association, dice a Robert Silk di non essere impressionato:

Careen della IATA ha affermato che non è chiaro che i produttori di aeromobili possano persino fornire tutti i filtri altimetro richiesti entro tali scadenze. “La FAA afferma che c’è consenso su questa data, ma non c’è. … Sono disposto a investire denaro in questo momento che … vedremo enormi interruzioni. “

Ha richiamato l’attenzione sulle regole in Francia. Le zone cuscinetto lì, ha detto, sono [4.8x bigger than] le concessioni temporanee che AT&T e Verizon hanno concordato negli Stati Uniti Inoltre, la Francia richiede che le antenne siano inclinate verso il basso, limitando al contempo la potenza delle trasmissioni vicino agli aeroporti a meno della metà della potenza trasmessa dalle società di telecomunicazioni statunitensi.

Ma Jon Brodkin non riesce a capire di cosa si tratta…Le correzioni dell’altimetro consentiranno ad AT&T e Verizon di implementare completamente il 5G sullo spettro della banda C:

La Federal Communications Commission nel febbraio 2020 ha approvato l’uso mobile nella banda C, in particolare da 3,7 a 3,98 GHz. Poiché gli altimetri degli aerei si basano su uno spettro da 4,2 GHz a 4,4 GHz, questo ha lasciato una banda di guardia di 220 MHz per proteggere gli altimetri. [It] è davvero 400 MHz in pratica quest’anno perché AT&T e Verizon non stanno ancora implementando sopra i 3,8 GHz.

La FCC ha rilevato che è improbabile che si verifichino interferenze dannose agli altimetri “in scenari ragionevoli” date le dimensioni della banda di guardia e i limiti di potenza richiesti dalla FCC. … La FCC ha anche esortato l’industria aeronautica a condurre ulteriori ricerche … “dato che apparecchiature ben progettate non dovrebbero normalmente ricevere alcuna interferenza significativa”. … La lentezza dell’industria aeronautica … potrebbe portare a nuove normative sui ricevitori simili alle regole che già richiedono ai dispositivi wireless di trasmettere solo nelle loro frequenze autorizzate.

Come siamo finiti in questo pasticcio? drinkypoo aggiunge prospettiva:

Abbiamo regole sull’allocazione delle frequenze specificamente per evitare problemi come questi. Gli ingegneri che hanno progettato questi altimetri e i manager che hanno firmato i progetti sono quelli in colpa qui. Hanno collaborato per creare un problema futuro, a scopo di lucro.

All’epoca faceva parte del panorama legale che le assegnazioni di frequenza potessero essere risolte per altri scopi. Una buona ingegneria tiene conto del panorama normativo. …Questi dispositivi [are not] così vecchi da precedere le allocazioni di frequenza.

Ma ma ma ma… lo è sicurezza fondamentale! Questo argomento non si lava con dooferorg:

Le compagnie aeree e i produttori di aeromobili sono pigri. … Supera te stesso, sul serio. Avrei dovuto progettare le cose meglio dall’inizio se sono così “critiche per la sicurezza”.


Il morale della favola:
Assomigli al fiore innocente, ma sii il serpente sotto di esso

Hai letto La vista lunga di Richi Jennings. Puoi contattarlo a @RiCHi oro [email protected].

Immagine: superficie (tramite Unsplash; livellata e ritagliata)

Leave a Comment