recenti...

SorAldo : elezioni on-line a breve di venta un servizio
Modulo Team per WebShool
Webschool: patch per PhPNuke 6.0

Serverless per promo e campagne lampo: scalare senza pensieri

Ãˆ sera. Il team marketing ha messo online un codice sconto valido 48 ore. La spesa media sale, i click esplodono. Il traffico fa 30x in dieci minuti. I carrelli si bloccano a tratti. Le API iniziano a dare 429. Il team guarda i grafici. La paura non Ã¨ perdere utenti domani. Ãˆ perderli ora, nei prossimi 5 minuti.

Il serverless nasce per momenti cosÃ¬. Non ti compra la fortuna, ma ti dÃ elasticitÃ . Tu paghi per richiesta. Il cloud scala in modo rapido. PerÃ² ci sono limiti, code, freddi â€œcold startâ€. E ci sono costi se sbagli settaggi. In questa guida andiamo dritti al punto, senza fumo.

Cosa troverai: pattern semplici che reggono i picchi, cache allâ€™edge, code, idempotenza per i pagamenti, test rapidi, numeri da guardare, un playbook di 72 ore. Parliamo anche di privacy, di quote dei provider, e di come stimare i costi per 24â€“48 ore di fuoco.

Quello che non ti dice la brochure

La brochure parla di scala â€œinfinitaâ€. In realtÃ hai tetti per account, per regione, per servizio. Le funzioni possono partire a freddo e perdere 100â€“500 ms in piÃ¹. Alcune partizioni di dati diventano â€œhotâ€. Le API esterne possono darti backâ€‘pressure. Serve un piano B: code e degrado elegante.

Controlla con cura i limiti del runtime. Ad esempio, qui trovi come funziona lo scaling e limiti di Lambda. Ogni provider ha regole diverse. Verifica prima di lanciare una campagna lampo.

Fai difese chiare al bordo: throttling e rate limit. Muovi le richieste in una coda quando la sorgente spinge troppo. Le buone pratiche sono raccolte nelle linee guida di rate limiting. Ãˆ meglio una risposta 429 pulita che un timeout lungo e costoso.

Scelte di architettura per picchi improvvisi

Pattern rapidi che salvano la notte

API stateless davanti, coda in mezzo, worker dietro. Ãˆ un classico. Lâ€™utente ottiene un â€œok, stiamo processandoâ€. Il lavoro pesante va in coda. Il worker scala con il carico. Questo rende il picco liscio e protegge i sistemi lenti.

Container serverless con autoscaling sono utili per endpoint che restano caldi. Un esempio Ã¨ lâ€™autoscaling di Cloud Run. Tieni alti i limiti di concorrenza per risposte brevi e coste meno.

Funzioni allâ€™edge riducono latenza per pagine e API leggere. Puoi fare cache su HTML e JSON che non sono personali. Guarda i Workers allâ€™edge se hai pubblico globale. Metti TTL corti e invalida quando serve.

Feature flag e switch rapidi sono vitali. In caso di stress spegni parti pesanti: raccomandazioni costose, filtri dinamici, o immagini XL. Un flag puÃ² salvare un checkout in 5 secondi.

Per una visione meno â€œmarketingâ€ e piÃ¹ di sostanza, ecco una overview indipendente su cosa Ã¨ serverless e dove ha senso.

Dati e storage senza sorprese

Per promo brevi usa dati a vita corta. Metti TTL su carrelli, token e link. Per letture veloci usa KV e cache. Per scritture intense distribuisci le chiavi. Evita partizioni â€œcaldeâ€. Per analytics usa una pipeline separata, asincrona, cosÃ¬ non tocchi il percorso critico.

OsservabilitÃ che parla chiaro

Segui i segnali dâ€™oro: latenza, traffico, errori, saturazione. Tieni grafici semplici, con soglie nette. Un buon punto di partenza sono i segnali dâ€™oro SRE. Aggiungi alert su lunghezza coda, tassi 5xx, e budget di errore.

Vuoi capire lâ€™edge senza parole complicate? Questo post spiega in modo chiaro cosâ€™Ã¨ lâ€™edge computing e perchÃ© aiuta con utenti lontani.

Matrice di scelta per campagne lampo

Qui sotto trovi una tabella pratica. Scegli il tipo di campagna, guarda pattern, coda, cache, test e obiettivi. I costi sono indicativi: ogni provider ha tariffe diverse e possono cambiare nel tempo.

Flash sale retail	24â€“48h	Checkout	API stateless + coda + worker	Queue gestita (SQS/PubSub/Equiv.)	CDN + cache su HTML/JSON	NoSQL con TTL carrelli	Concorrenza provisioned per endpoint caldi	429 + chiavi idempotenti sul pagamento	k6: p95 < 300ms, errori < 1%	â‚¬30â€“â‚¬120	RTO < 15m / RPO < 1m
Prevendita biglietti	6â€“12h	Code fair e prenotazioni	Gateway + coda + token â€œslotâ€	Queue + dead-letter	Edge rules per region lock	KV per token, DB transazionale per esiti	Warmâ€‘up a finestre	Token bucket per IP/utente	Artillery: burst 60s, no drop	â‚¬20â€“â‚¬90	RTO < 10m / RPO < 1m
Bonus iGaming weekend	12â€“24h	Registrazioni / bonus	Edge cache + funzioni leggere	Queue per email/bonus	Workers allâ€™edge	KV per landing, R2/Blob per log	Pre-warm edge per geo top	Rate limit + idempotenza webhook	k6: spike 30x in 5m	â‚¬15â€“â‚¬70	RTO < 10m / RPO < 1m
Drop influencer	2â€“6h	Lead e microâ€‘checkout	API + KV cache + coda lenta	Queue per postâ€‘process	CDN con staleâ€‘whileâ€‘revalidate	NoSQL + TTL 24h	Provisioned su 2â€“3 funzioni	Limite per referral	Smoke + stress 10 min	â‚¬10â€“â‚¬50	RTO < 10m / RPO < 1m
Charity spike	24h	Donazioni	API + coda + worker batch	Queue con retry backoff	CDN + WAF	DB con write burst + indici	Canary + warm su orari chiave	Idempotenza su webhook PSP	p95 < 400ms, errori < 2%	â‚¬20â€“â‚¬80	RTO < 20m / RPO < 5m
BFCM	48â€“72h	Vendite	API + coda + edge cache forte	Queue + DLQ + metriche	CDN globale + immagini ottimizzate	NoSQL + stream per analytics	Concorrenza provisioned + pre-warm	Rate per IP/utente/route	Stress 1h continuo	â‚¬50â€“â‚¬200	RTO < 15m / RPO < 1m
Preordini tech	24h	Preâ€‘registrazioni	Form edge + coda + batch	Queue FIFO	Edge + geoâ€‘routing	KV + storage oggetti	Ping periodico su funzioni	Rate per device	Spike 15m, no errori fatali	â‚¬12â€“â‚¬60	RTO < 15m / RPO < 1m
Live streaming Q&A	2â€“4h	Chat / sondaggi	WebSocket gestito + fanâ€‘out	Stream + buffer	CDN + edge rules	Cache inâ€‘memory + store KV	Warm sugli shard attivi	Limite messaggi/minuto	Soak test 30m	â‚¬8â€“â‚¬40	RTO < 10m / RPO < 1m

Numeri che contano davvero

Latenza p95: Ã¨ il numero da fissare in testa. Se p95 supera 300 ms per API core, la UX soffre. Guardalo per route, non solo in media.

Rapporto cache hit: 80% su contenuti pubblici Ã¨ un buon inizio. A 90% la spesa scende molto. Se sei sotto 60%, rivedi le regole di cache.

Code: lunghezza e tempo medio in coda. Una coda oltre 30â€“60 secondi su lavoro critico Ã¨ un segnale rosso. Scala i worker o riduci peso del task.

Budget di errore: definisci 0.5â€“1% sul periodo della promo. Se lo bruci in anticipo, riduci carico con flag o downscale di funzioni non critiche.

Playbook operativo: le prime 72 ore

Tâ€‘24h: preparazione secca

Esegui test di carico su endpoint chiave con profilo realistico.
Accendi WAF, rate limiting, e regole per bot.
Preâ€‘riscalda funzioni e cache nelle regioni top.
Imposta alert su p95, errori, lunghezza code, 429.
Prepara flag per spegnere feature pesanti.
Condividi un runbook di escalation con contatti e soglie.

Live 0â€“48h: occhi sui grafici, dita sui flag

Monitora code ogni 5â€“10 minuti. Se la coda sale, aumenta i worker.
Se vedi 5xx sopra soglia, attiva modalitÃ â€œleggeraâ€ su pagine ad alto traffico.
Riduci tempo di TTL su cache se i contenuti cambiano spesso.
Se un provider impone limiti, metti backâ€‘pressure lato gateway e mostra messaggi chiari.
Traccia costi orari per evitare sorprese a fine evento.

T+24h: spegnimento pulito e retrospettiva

Scala giÃ¹ la concorrenza provisioned e i worker extra.
Draina le code e riconsegna i falliti con calma.
Segna numeri finali: p95, errori, costi, tasso di conversione.
Scrivi un postâ€‘mortem breve con 3 cose da fissare per la prossima volta.

Microâ€‘case e settori con picchi feroci

Ticketing: lâ€™apertura alle 10:00 crea una valanga. La coda controlla il ritmo. Il token â€œslotâ€ evita la corsa allâ€™ultimo byte. Il gateway risponde sempre in pochi ms, il lavoro serio si fa dopo.

Retail: un video virale manda 50k utenti in un minuto. La cache edge regge le landing. Le API scrivono in coda. I worker aggiornano stock e conferme. La UX resta fluida e tu non bruci il budget.

iGaming: nei portali di recensioni si vedono spike netti in â€œbonus weekendâ€ o con influencer. Qui una architettura serverless con code e cache edge evita colli e riduce drop in signup. Esempio concreto: guide e confronti su blackjack online casinÃ², con test A/B su landing lampo e messaggi chiari sul gioco responsabile. Tieni limiti, log puliti e idempotenza sui webhook di bonus.

Black Friday: chi fa eâ€‘commerce sa che Ã¨ un gioco di minuti. Per ispirazione su come gestire picchi enormi, leggi come lavora il team di Shopify Engineering. Ãˆ un mondo diverso, ma i principi di base restano.

Costi senza sorprese

Il bello del serverless Ã¨ pagare a consumo. Il rischio Ã¨ far partire troppi task inutili. Fai due conti rapidi: richieste x costo unitario + storage x GB + egress. Aggiungi un 20% di cuscino per sicurezza. Se la cache fa 80â€“90% di hit, i costi crollano. Se fai molto I/O su DB con chiavi â€œcaldeâ€, la spesa sale. Taglia le scritture duplicate. Metti batch dove non serve risposta in tempo reale.

Un trucco: misura â€œcosto per 10k richiesteâ€ prima della promo e tienilo come KPI. Se sale troppo durante lâ€™evento, guarda log, hit di cache e retry che girano a vuoto.

Legal, privacy, pagamenti

Raccogli solo i dati che servono. Pulisci i log da PII. Metti il Consent Mode per analytics. Proteggi i pagamenti: usa chiavi di idempotenza per ogni tentativo. Qui trovi come gestirle con esempi chiari: chiavi di idempotenza nei pagamenti. Per gli errori, fai retry con backoff e tetto massimo. Non rifare ad oltranza.

Checklist di produzione in 60 minuti

Abilita cache edge per landing e API pubbliche (TTL brevi, invalidazione chiara).
Aggiungi coda tra API e servizi lenti. Imposta DLQ e metriche.
Setta rate limit al gateway. Definisci messaggi 429 utili.
Attiva provisioned concurrency solo su 2â€“3 funzioni calde.
Crea 3 alert: p95, 5xx, lunghezza coda. Soglie semplici.
Lancia un test rapido con test di carico con k6. Simula il primo minuto del picco.
Prepara flag per spegnere funzioni costose in un click.

FAQ concrete

Ãˆ un modello dove non gestisci server. Paghi per uso. Scala in fretta. Per picchi brevi Ã¨ ideale perchÃ© non tieni macchine accese tutto il giorno.

Come posso ridurre i cold start durante un flash sale?

Preâ€‘riscalda le funzioni nelle regioni top. Usa provisioned concurrency solo per endpoint caldi. Tieni pacchetti leggeri e poca inizializzazione.

Quali limiti pratici devo considerare?

Quote per invocazioni, concorrenza, connessioni al DB, e burst per account. Leggi le quote del tuo provider e prova con test. Se superi i limiti, attiva code e backâ€‘pressure.

Quanto puÃ² costare gestire 1M di richieste in 24 ore?

Dipende da cache hit, peso delle funzioni e uscite di rete. In molti casi parliamo di decine o poche centinaia di euro. Con cache alta i costi scendono molto.

Che differenza câ€™Ã¨ tra edge e region?

Lâ€™edge Ã¨ vicino allâ€™utente e serve contenuti statici o logica leggera. La region Ã¨ il data center dove vivono i dati e i servizi pesanti. Insieme danno bassa latenza e affidabilitÃ .

Come faccio un test realistico in meno di 2 ore?

Prendi 3 endpoint chiave. Crea scenari di spike veri (30x in 5 minuti). Usa un tool semplice. Guarda p95, errori, e coda. Aggiusta e ripeti una volta.

Autore e metodologia

Autore: architetto cloud e SRE. Ho messo in produzione stack serverless per retail, ticketing e media. Ho visto picchi 20â€“60x in minuti. In questa guida ho raccolto pattern che hanno retto in casi reali.

Metodologia: test con k6 e Artillery su scenari â€œspikeâ€ e â€œstressâ€, misure su p95, hit di cache, lunghezza coda e costi per 10k richieste. Ho citato fonti tecniche aperte. Limiti e prezzi possono cambiare. Ultimo aggiornamento: giugno 2026.

Nota: questa guida non Ã¨ consiglio finanziario. Per il gioco, promuovi sempre pratiche di responsabilitÃ e tutela dellâ€™utente.