System1 Star Rating Spiegato: Come Si Interpretano i Numeri (2026)

Q: Posso fidarmi di System1 per decisioni di budget creative?

Direzionalmente sì, assolutamente sì. Star Rating ha correlazione documentata con sales lift su database 100k+ spot. Non è oracolo perfetto: spot 4-star possono fallire e 2-star possono vincere per fattori specifici (media buy, distribuzione, competitor). Ma usato come uno dei criteri di decisione, riduce significativamente il rischio "spot disastroso".

Q: System1 funziona per spot social-first short-form?

Sì, System1 ha versione adattata per content TikTok/Reels short. Database più piccolo, calibrazione meno consolidata. Per PMI heavy-social: indicativo, non gold standard.

Q: Come scegliere tra Star Rating e Spike Rating come metric prioritaria?

Dipende dall'obiettivo della campagna. Brand building (long-term): Star Rating prioritario. Direct response/promo time-limited: Spike Rating. Mixed campaigns: monitorare entrambi, target Star > 3 + Spike presente.

In sintesi: System1 Test Your Ad misura la risposta emotiva di 150 consumatori a uno spot e la converte in Star Rating (1.0-5.9) che predice il long-term ROI. Spot 5+ star generano in media 3x ROI vs baseline. Tre metriche complementari: Star Rating (long-term sales lift), Spike Rating (short-term lift 1-7 giorni), Fluency Rating (brand recognition). Esempi paradigmatici: Aldi Kevin the Carrot (5.9), Apple "Mac vs PC", Volkswagen "Lemon". Limiti: poco rappresentativo per Italia, B2B, direct response.

Cos'è System1 (e perché è diverso da altri pretest)

System1 è un'azienda fondata nel 2000 (originally Brainjuicer) da John Kearon. Da Orlando Wood (co-author "System1 effectiveness research") in poi, l'azienda ha sviluppato Test Your Ad: un metodo di pretesting di spot che misura la risposta emotiva non-conscious dei consumatori, partendo dalla teoria System 1/System 2 di Daniel Kahneman.

Differenza con i pretest tradizionali (focus group, recall test, copy test): System1 misura la feeling response al filmato — la reazione automatica, prima del giudizio razionale. Le metriche tradizionali misurano cosa il consumatore dice di pensare (post-rationalization spesso poco predittiva di vendite). System1 misura cosa il consumatore sente nel momento (predittivo di memorabilità e sales lift).

Star Rating: scala 1.0-5.9, right-brain test

Lo Star Rating è la metrica principale. Range 1.0 (worst) a 5.9 (best). Misurata su 150 consumatori target che vedono lo spot e completano un test di feeling con interfaccia "Smiley faces" (7 emozioni: very happy, happy, neutral, sad, angry, surprise, contempt).

Ogni emozione ha un peso. La distribuzione delle risposte produce uno score normalizzato. L'output (1.0-5.9 stars) è calibrato su database di 100,000+ spot ed è correlato con sales lift long-term documentato (12-24 mesi post-air).

Star Rating	% spot	ROI multiplier vs baseline
1.0-1.9	35-40%	0.5-0.8x
2.0-2.9	30-35%	0.8-1.2x
3.0-3.9	15-20%	1.2-1.8x
4.0-4.9	8-12%	1.8-2.5x
5.0-5.9	3-5%	2.5-3.5x

I migliori spot al mondo (Cannes Lions Effectiveness winners) clusterano nel range 4.5-5.9. La maggior parte degli spot mass market è 1.5-2.5: a malapena ROI-positive.

Spike Rating: short-term lift

Lo Spike Rating misura il potenziale di sales lift immediato (giorni 1-14 dopo air). Distinto dallo Star Rating perché:

Star Rating: brand building cumulativo, mental availability, ROI 12-24 mesi.
Spike Rating: response immediato, conversione promo, ROI 1-2 settimane.

Spot ad alto Spike Rating spesso hanno: scarcity message, CTA chiaro, promo tempo-limitata, urgency. Spot ad alto Star Rating spesso hanno: feeling positivo, character, storytelling, brand integrato.

I due possono coesistere ma non sempre. Cannes Effectiveness winners tendono ad avere alto Star + medio Spike. Direct response winners (DR commercials) alto Spike + basso Star.

Fluency Rating: brand recognition

Fluency misura la percentuale di viewer che riconoscono correttamente il brand mostrato. È critico perché un spot brillante senza brand recognition = "vampire effect" (cattura attenzione ma non costruisce equity).

Soglia di alert: Fluency < 70%. Sotto questo livello, lo spot performs ma il brand non beneficia. Soglia ottima: 80-90%.

Pattern recurring per fluency alto: brand presente all'inizio E alla fine, distinctive brand assets (color, sound, character) integrati nella narrazione, brand voice congruente con tone narrativo.

Esempi paradigmatici

Aldi UK "Kevin the Carrot" (Christmas 2016-2024). Star Rating 5.9 (massimo). Personaggio (Kevin), storytelling positivo, brand chiaramente Aldi. ROI documentato in IPA Effectiveness Awards: lift di market share +3.2 punti percentuali su 8 anni.

Apple "Mac vs PC" (2006-2009). Star Rating range 4.5-5.5. Character (Justin Long, John Hodgman), tone humour, brand framing. Ha cementato il posizionamento "creative pro" Apple per oltre un decennio.

Volkswagen "Lemon" (1959). Spot stampa, ma analizzabile retroattivamente: massimo livello System1 per uniqueness + emotional response (twist umoristico). Caso paradigmatico DDB era.

IKEA "Lamp" (Spike Jonze, 2002). Star Rating 5.5+. Storytelling minimale (lampada gettata via, eroe finale ironico), feeling positivo via humour subverted. Cannes Lion Grand Prix.

Amazon "Moving Day" / "Alexa Loses Voice" (2018-2019). Multiple spot Super Bowl Star Rating 5.5+. Pattern: character, humour, brand integrato.

Limiti del framework

(1) Bias culturale. System1 ha database principalmente UK/US. Per Italia, Germania, Giappone, le calibrazioni sono meno robuste. Spot di humour anglosassone può non transfer in mercato italiano (e viceversa).

(2) Non per B2B. Il framework è validato su spot consumer. Per B2B SaaS, B2B industrial, healthcare professional, non c'è benchmark robusto.

(3) Non per direct response. Star Rating misura long-term sales lift. Per spot DR (call center, e-commerce CTA), Spike Rating è più rilevante. Star Rating può essere basso ma spot DR ROI-positivo.

(4) Costo. Test Your Ad costa €5-15k per spot. Per piccoli brand con budget production limitato, può essere over-investment.

(5) Non sostituisce media planning. Star Rating 5.9 + media buy debole = nessun risultato. Star Rating + reach strategica = effetto compound.

Alternative low-budget per PMI

(1) DIY pretest. Mostra lo spot a 20-30 persone target, ask: "Su scala 1-7, come ti senti?". Calcolare media. Non è System1 calibrato, ma direzione utile per scelta tra alternative creative.

(2) Facebook Ad Library benchmark. Confrontare CTR, completion rate del proprio spot con benchmark settoriale Facebook (visibile pubblicamente). Sopra benchmark = spot performante.

(3) Google Ads Brand Lift Study. Per advertiser Google Ads, lift study integrato gratuito (eligibility threshold di spend). Misura brand awareness lift su YouTube ads.

(4) Brain Boost / TestApe / similar low-cost tools. €500-3000 per spot, panel limitato ma framework simile. Limitations: meno robusto di System1 ma utile per directional choice.

(5) Pre-test creative agenzia. Molte agenzie boutique offrono pretest interno (focus group, qual research) come parte del pricing creative.

Workflow integrato per PMI

Sviluppo concept: 3-4 alternative creative.
DIY pretest: 20-30 persone target su feeling response. Selezionare top 1-2.
Production: rough cut o finished depending budget.
Test paid (System1 o alternative): validation finale prima di air.
Airtime: con monitoring brand search, social mention, sales.
Post-campaign: confronto Star Rating predetto vs sales lift effettivo. Calibrazione modelli interni.

FAQ

Posso fidarmi di System1 per decisioni di budget creative?

Direzionalmente sì, assolutamente sì. Star Rating ha correlazione documentata con sales lift su database 100k+ spot. Non è oracolo perfetto: spot 4-star possono fallire e 2-star possono vincere per fattori specifici (media buy, distribuzione, competitor). Ma usato come uno dei criteri di decisione, riduce significativamente il rischio "spot disastroso".

System1 funziona per spot social-first short-form?

Sì, System1 ha versione adattata per content TikTok/Reels short. Database più piccolo, calibrazione meno consolidata. Per PMI heavy-social: indicativo, non gold standard.

Come scegliere tra Star Rating e Spike Rating come metric prioritaria?

Dipende dall'obiettivo della campagna. Brand building (long-term): Star Rating prioritario. Direct response/promo time-limited: Spike Rating. Mixed campaigns: monitorare entrambi, target Star > 3 + Spike presente.

Star Rating bassa significa "fail" garantito?

No, ma "underperformance probabile". Spot con Star 1-2 generano in media ROI 0.5-1x (sostanzialmente: brand spende soldi senza generare lift). Decision: rivedere prima di air, modificare montaggio, music, ending.

Quanto è importante Fluency Rating vs Star Rating?

Fluency è gate: sotto 70% lo Star Rating non si traduce in benefit brand. Sopra 70% Fluency, Star Rating diventa il driver principale. Pattern: ottimizzare prima fluency (brand presente, distinctive assets), poi Star Rating (feeling response).

Posso usare i pattern System1 senza fare il test?

Sì, parzialmente. I principi (presenza personaggio, atmosfera positiva, brand integrato, ending memorabile, music distintiva) sono replicabili in fase concept anche senza test formale. Il test convalida; i principi guidano la creazione.

Fonti e riferimenti

System1 — Test Your Ad methodology e database: system1group.com
Wood, O. — "Lemon: How the Advertising Brain Turned Sour" (System1, 2019)
Wood, O. — "Look Out: How the Right Brain Sees Things Whole" (System1, 2021)
Kahneman, D. — "Thinking, Fast and Slow" (2011, Farrar, Straus and Giroux) — fondamento System 1/2
Binet, L. & Field, P. — "The Long and the Short of It" (IPA, 2013)
IPA Effectiveness Awards — case studies con System1 score correlation
Cannes Lions Creative Effectiveness — annual reports
Romaniuk, J. — "Building Distinctive Brand Assets" (2018) — concept fluency
Brain Boost / TestApe — alternative pretest tools docs