Il giorno in cui il mio robot ha disegnato un cane-gatto... e perché i tuoi prompt sono importanti
Hai mai chiesto a un'AI di disegnare un gatto e ti è tornato qualcosa che sembra un procione che fa un'audizione per una pubblicità di shampoo? Sì, ci sono passato. La generazione di immagini di Grok può essere brillante, degna di un poster, ma solo se gli parli come un regista che sa davvero cosa vuole. La magia non è solo nel modello. È nel tuo prompt. E oggi sistemeremo i tuoi prompt in modo che Grok smetta di produrre patate alla Picasso e inizi a sfornare immagini di qualità da galleria.
Attenzione: questa è una guida pratica con formule di prompt reali, esempi e insidie comuni. Alla fine, saprai come utilizzare la generazione di immagini di Grok, creare prompt efficaci per le immagini e ottenere effettivamente l'immagine che intendevi, non quella che il tuo cugino robot ha capito male.
Grok Image Generation 101: cos'è, cosa non è e perché a volte disegna troppe dita
La generazione di immagini di Grok funziona come un assistente di studio che ascolta molto attentamente, poi improvvisa selvaggiamente se lasci troppo spazio. Traduce le tue descrizioni testuali in immagini abbinando i modelli che ha imparato. Pensa: "Descrivi la scena, lo stile, l'atmosfera e i dettagli tecnici", e Grok costruisce i pixel.
Importante verifica della realtà:
- Più specifico è il tuo prompt, più fedele sarà il risultato.
- Stile, illuminazione, angolazione della telecamera: questi contano più di quanto pensi.
- Volti, mani e testo possono ancora essere difficili. Pianifica nuove prove e iterazioni.
Se vuoi una copertina di un album, non dire "copertina di un album". Dì: "composizione audace e ad alto contrasto per la copertina di un album, soggetto centrato, texture di pellicola granulosa, retroilluminazione drammatica, area di testo del titolo in alto." Vedi la differenza? Tu sei il regista. Grok è la troupe.
La formula: come scrivere prompt di Grok che funzionino davvero
Ecco una semplice formula di prompt che trasforma il caos in arte:
Scena + Soggetto + Stile + Composizione + Illuminazione + Colore + Fotocamera + Atmosfera + Qualità + Vincoli
Analizziamo questo in uno stile adatto a Grok.
- Scena: dove siamo? Al chiuso, all'aperto, su Marte, in una minuscola cucina newyorkese?
- Soggetto: Chi/cosa? Sii specifico. "Una Vespa scooter rossa vintage" è meglio di "uno scooter".
- Stile: Illustrazione, fotorealistico, acquerello, ispirato a Studio Ghibli (evita di copiare artisti per nome se non è consentito), cyberpunk, minimalista.
- Composizione: Primo piano, campo medio, campo largo; centrato, regola dei terzi; spazio negativo per il testo.
- Illuminazione: Morbida luce mattutina, retroilluminazione al neon, ora d'oro, cinematografica.
- Colore: La tavolozza dei colori è importante: pastello, monocromatico, duotone, saturo.
- Fotocamera: Obiettivo da 35 mm, macro, aereo, angolazione bassa, bokeh f/1.8.
- Atmosfera: Calma, stravagante, minacciosa, energica.
- Qualità: 4K, alta definizione, messa a fuoco nitida.
- Vincoli: Nessun testo, nessuna filigrana; soggetto singolo; simmetrico; proporzioni.
Suggerimento da professionista: Non scrivere un romanzo. Scrivi una descrizione della scena. Punta a 1–3 frasi più alcuni parametri strutturati.
Prompt Makeover: da Vago a Vogue
Prompt sbagliato: "Un gatto."
Prompt migliore: "Gatto soriano arancione sdraiato su un davanzale, fotorealistico, morbida luce mattutina, profondità di campo ridotta, obiettivo da 50 mm, calda tavolozza pastello, atmosfera calma, alta definizione, soggetto singolo, 3:2."
Prompt sbagliato: "Città di notte."
Prompt migliore: "Strada cyberpunk di Tokyo di notte, riflessi al neon sul pavimento bagnato, grandangolo, alto contrasto, illuminazione cinematografica, blu e magenta profondi, sfocatura del movimento della folla, alta definizione, 16:9."
Prompt sbagliato: "Crea un logo."
Prompt migliore: "Emblema minimalista in stile vettoriale per un'app di escursionismo, silhouette stilizzata di montagna con un sentiero, design piatto, tavolozza a due colori (verde foresta e crema), composizione centrata, aspetto di sfondo trasparente, nessun testo, alto contrasto, quadrato."
Vedi lo schema? Contesto + stile + vincoli. Grok non può leggere nella tua mente. Ancora.
Come utilizzare la generazione di immagini di Grok: una rapida guida passo-passo
- Decidi il tuo obiettivo: post sui social media, banner pubblicitario, mockup di prodotto, copertina di presentazione, mood board.
- Scrivi un primo prompt utilizzando la formula.
- Aggiungi vincoli: proporzioni, soggetto singolo, note sulla composizione, nessun testo se prevedi di aggiungerlo in seguito.
- Genera. Respira. Resisti al riflesso di panico di rigenerare 47 volte.
- Rivedi e itera con una modifica alla volta. Non buttare il lavandino della cucina al secondo prompt.
Esempio di iterazione:
- Primo prompt: "Cappuccino fotorealistico su un tavolo di marmo, dall'alto, cuore di latte art, morbida luce naturale, tavolozza neutra, 4K, 1:1."
- Risultato troppo scuro? Follow-up: "Aumenta leggermente l'esposizione, aggiungi punti luce più caldi."
- La schiuma sembra strana? "Texture della schiuma più nitida, latte art più chiaro, riduci la grana."
Trattalo come una conversazione con uno stagista di design molto letterale che sta facendo del suo meglio.
I mattoni visivi: stili, illuminazione, obiettivi e composizione
- Stili che Grok comprende bene: fotorealismo, acquerello, vettoriale piatto, rendering 3D, isometrico, poster retrò, mezzatinta da fumetto, low-poly.
- Indicazioni di illuminazione che contano: ora d'oro (bagliore caldo), softbox (illuminazione uniforme), rim lighting (bordi del soggetto drammatici), neon (alto contrasto, colori saturi), chiaroscuro (lunatico, ricco di ombre).
- Obiettivi e linguaggio della fotocamera: 24 mm per scene ampie; 50 mm per una prospettiva naturale; 85 mm per ritratti; macro per i dettagli; f/1.8 per il bokeh; aereo/drone per la vista dall'alto.
- Guida alla composizione: regola dei terzi per scatti bilanciati; simmetria centrale per poster audaci; spazio negativo per sovrapposizioni; primo piano per dettagli del prodotto; campo largo per l'ambiente.
Aggiungi due o tre di questi per prompt. Non tutti. Stai preparando un piatto, non un'esplosione di un porta spezie.
Modelli di prompt che puoi rubare (per favore, fallo)
- Immagine hero del prodotto: "Elegante smartwatch in acciaio inossidabile su una superficie nera opaca, illuminazione da studio fotorealistica con riflessi tenui, obiettivo da 85 mm, profondità di campo ridotta, composizione centrata, alta definizione, spazio in alto per il titolo, 4:5."
- Foto di stile di vita: "Giovane pendolare che attraversa un passaggio pedonale sotto una pioggia leggera, marciapiede riflettente, sfocatura del movimento, stile fotografico di strada candido, tavolozza smorzata, obiettivo da 35 mm, luce naturale, regola dei terzi, 16:9."
- Illustrazione: "Accogliente illustrazione di un angolo di lettura, calde mensole di legno, piante, un gatto soriano rannicchiato su una sedia, stile vettoriale piatto con grana testurizzata, tavolozza terrosa, morbido bagliore ambientale, contorni puliti, 1:1."
- Sfondo pubblicitario social: "Modelli di onde di sfumature astratte, blu e viola duotone, curve morbide, rumore visivo minimo, ampio spazio negativo a destra, nitido, 16:9."
- Copertina della presentazione: "Moderno skyline minimalista della città all'alba, morbido cielo con sfumatura pastello, stile line-art sottile, composizione ampia con area del titolo chiara in alto a sinistra, alta risoluzione, 16:9."
Copia, incolla, modifica. Non è imbrogliare. È efficiente.
L'anatomia di un prompt Grok efficace (annotato)
Prompt: "Ritratto fotorealistico di una maratoneta che si allaccia la scarpa all'alba, retroilluminazione dell'ora d'oro, respiro visibile nell'aria fresca, obiettivo da 85 mm, profondità di campo ridotta, punti luce caldi, ombre tenui, alta definizione, soggetto singolo, spazio negativo a sinistra per il testo, 4:5."
Perché funziona:
- Soggetto e azione chiari (corridore che si allaccia la scarpa)
- Ora e luce (alba, retroilluminazione dell'ora d'oro)
- Fotocamera e composizione (85 mm, DoF, spazio negativo a sinistra)
- Atmosfera e texture (respiro nell'aria fresca, punti luce caldi)
- Vincolo pratico (proporzioni per il poster)
Risolvere i quattro grandi problemi (e i prompt che ti salvano)
- Suggerimento: usa scatti medi invece di primi piani estremi. Aggiungi "proporzioni naturali, simmetria facciale pulita, texture della pelle realistica" e tieni le mani lontane da oggetti di scena complessi.
- Esempio: "Ritratto a mezzo busto, proporzioni naturali, texture della pelle realistica, mani tagliate fuori, luce principale soffusa, sfondo neutro."
- Testo o filigrane indesiderati
- Suggerimento: dì "nessun testo, nessuna filigrana, sfondo pulito." Se hai bisogno di testo, aggiungilo in seguito in uno strumento di progettazione.
- Esempio: "Set di icone vettoriali piatte, larghezza uniforme dei tratti, nessun testo, nessuna filigrana, aspetto trasparente, griglia di layout quadrata."
- Risultati eccessivamente affollati
- Suggerimento: limita il numero di soggetti. Specifica "soggetto singolo" o "sfondo minimo".
- Esempio: "Singolo albero bonsai su una pietra liscia, ambiente da studio minimalista, illuminazione superiore morbida, profondità ridotta, spazio negativo, 3:2."
- Mashup di epoche/stili sbagliati
- Suggerimento: sii esplicito riguardo al decennio e allo stile. Dì "aspetto da pellicola a colori degli anni '70" invece di solo "retrò".
- Esempio: "Estetica da pellicola a colori degli anni '70, grana sottile, colori leggermente sbiaditi, vignettatura morbida, scena di strada candida, obiettivo da 35 mm."
Proporzioni: perché la tua storia di Instagram e la tua presentazione non condividono i pantaloni
- Quadrato (1:1): riquadri prodotto, avatar, griglie pulite.
- Verticale (4:5 o 9:16): post e storie di Instagram, annunci per dispositivi mobili.
- Orizzontale (16:9): miniature di YouTube, diapositive, banner hero.
- Adatto alla stampa (3:2, 4:3): poster, volantini.
Aggiungi le proporzioni al tuo prompt. Evita ritagli imbarazzanti in seguito.
Strategia di iterazione: la regola "Una manopola alla volta"
Quando Grok sbaglia il bersaglio, resisti alla voglia di riscrivere tutto. Cambia una cosa per iterazione:
- Modifica dell'illuminazione: "Passa a una luce soffusa e nuvolosa."
- Modifica della composizione: "Passa alla regola dei terzi, soggetto a destra."
- Modifica del colore: "Usa una tavolozza pastello smorzata."
- Modifica dello stile: "Passa all'illustrazione vettoriale piatta."
Perché? Perché se cambi cinque cose e l'immagine migliora, non saprai quale modifica ha fatto la differenza. Non stai solo creando un'immagine, stai imparando come Grok ti ascolta.
Vincoli creativi: la salsa segreta per la coerenza
Vuoi un aspetto del marchio coerente in tutta una campagna? Crea una mini guida di stile all'interno del tuo prompt:
- "Toni della terra smorzati, texture a grana morbida, leggera vignettatura, composizione centrata, ombra sottile sotto il soggetto, spazio per il titolo serif in alto a sinistra, 4:5."
Quindi riutilizza e scambia solo il soggetto. È come creare modelli, ma più cool.
Prompt per persone, prodotti o luoghi
- Persone: specifica la fascia di età, l'abbigliamento, la posa, l'emozione e l'ambientazione. Usa "proporzioni naturali" e "texture della pelle sottile". Mantieni le mani semplici.
- Luoghi: definisci l'ora del giorno, il tempo, il livello di attività e la tavolozza dei colori. Aggiungi l'angolazione della telecamera e la lunghezza focale.
Esempi rapidi:
- Persone: "Ritratto di uno chef di mezza età in camice bianco, sfondo caldo della cucina, luce principale soffusa, obiettivo da 85 mm, espressione naturale, profondità ridotta, alta definizione, 3:2."
- Prodotti: "Auricolari wireless neri opachi su una lastra di cemento, illuminazione perimetrale da studio per i bordi, messa a fuoco nitida, sfondo minimo, centrato, 4K, 1:1."
- Luoghi: "Nebbia nella pineta all'alba, tavolozza di colori blu-verde freddi, prospettiva dal basso verso l'alto, luce volumetrica soffusa, alta definizione, 16:9."
Creazione di prompt efficaci per immagini con riferimenti (quando aggiungere immagini)
Se puoi allegare immagini di riferimento, fallo, con parsimonia. Uno o due riferimenti aiutano Grok a fissare un aspetto o una posa. Aggiungi una breve direttiva testuale per decidere cosa seguire:
- "Corrispondi all'illuminazione del riferimento A; usa la tavolozza dei colori del riferimento B; mantieni la composizione centrata; nessun testo."
Se non puoi aggiungere riferimenti, usa indicazioni "come": "grana di pellicola morbida", "tavolozza smorzata simile a Kodak", "stile di blueprint isometrico". È il mood board a parole.
Prompt negativi: dì a Grok cosa non fare
Grok a volte "aiuta" furtivamente con oggetti di scena, texture o testo extra. Fermalo con i negativi:
- "Nessun testo, nessuna filigrana, nessun arto extra, nessuno sfondo affollato, nessun logo, nessun bordo."
Mantienilo breve e coerente. I negativi sono le cinture di sicurezza del tuo prompt, fastidiosi finché non ne hai bisogno.
Il controllo rapido del prompt di dieci secondi (prima di premere Genera)
Chiediti:
- Uno sconosciuto può immaginare questa scena dalle mie parole?
- Ho specificato lo stile, l'illuminazione e la composizione?
- Ho impostato le proporzioni e il numero di soggetti?
- Ho incluso negativi per inconvenienti comuni?
- Ho evitato parole vaghe come "cool" e "carino"? (La tua relazione del libro delle medie scuole ha chiamato. Rivuole i suoi aggettivi.)
Se sì, genera.
Casi d'uso reali: prompt di Grok per lavori comuni
- Banner di marketing: "Layout minimalista dell'hero del prodotto per un siero per la cura della pelle, flacone di vetro con finitura satinata su una piastrella di ceramica bianca lucida, luce da studio diffusa morbida, ombra sottile, spazio per il titolo a destra, alta definizione, 16:9, nessun testo."
- Miniatura di YouTube: "Foto illustrazione audace e ad alto contrasto di un laptop che scoppia di icone al neon, sfondo scuro, soggetto centrale, illuminazione perimetrale drammatica, composizione pulita, spazio negativo sovradimensionato per il titolo, 16:9."
- Sfondo per screenshot dell'app store: "Forme geometriche astratte, sfumature morbide in verde acqua e corallo, profondità delicata con ombreggiature, distrazione minima, 9:16."
- Copertina del report interno: "Illustrazione isometrica pulita di un rack del data center, blu e grigi freddi, bagliore sottile, contorni sottili, spazio per il titolo in alto a sinistra, nitido, 4:3."
- Grafica del poster dell'evento: "Skyline retro-futuristico con auto volanti, sfumatura di colore al tramonto, stile vettoriale nitido, composizione centrata, forme di silhouette audaci, 3:2."
Quando rigenerare vs. quando perfezionare
- Rigenera se: l'intera atmosfera è sbagliata: stile sbagliato, soggetto sbagliato, epoca sbagliata.
- Perfeziona se: le ossa sono buone: mantieni il nucleo e regola l'illuminazione, il colore o la composizione.
Pensa alla rigenerazione come all'avvio di una nuova ricetta; perfeziona come all'aggiunta di più sale. O, per chi non cucina, passa da "forte e sbagliato" a "giusto con le modifiche".
Vale la pena notare: usare Sider.AI per ottenere prompt perfetti più velocemente
Se stai testando molti prompt e non hai tempo per essere un sussurratore di AI a tempo pieno, Sider.AI può essere l'amico utile che è bravo con le parole. Incolla il tuo prompt grezzo e chiedigli di ottimizzare per la generazione di immagini di Grok con vincoli stilistici, prompt negativi e proporzioni. Sputerà una versione stretta e pronta all'uso più velocemente di quanto tu possa dire: "Perché questo gatto ha cinque orecchie?" È particolarmente utile per i team che necessitano di prompt di marca coerenti in tutte le campagne. Mosse avanzate: coerenza multi-scatto e look di serie
- Coerenza del personaggio: descrivi tratti e abiti ripetibili e blocca l'illuminazione e l'obiettivo. Esempio: "Stesso personaggio: capelli corti e ricci castani, occhiali rotondi, felpa con cappuccio blu navy; luce diurna dalla finestra; obiettivo da 50 mm; grana delicata; sfondo neutro." Riutilizza tra i prompt.
- Linguaggio del colore: definisci indicazioni simili a esadecimali a parole: "verde foresta profondo, crema caldo, terracotta smorzato".
- Continuità della texture: "Grana di carta sottile, leggera vignettatura, ombre tenui" su tutte le immagini mantiene una collezione coesa.
- Ritmo di composizione: alternare primi piani, medi e ampi per raccontare una storia in una serie.
Tabella di risoluzione dei problemi senza la tabella (perché, design)
- Troppo nitido o plastico: "Riduci leggermente la chiarezza, aggiungi grana morbida, punti luce più caldi."
- Troppo piatto: "Aumenta il contrasto, aggiungi luce sul bordo, approfondisci le ombre."
- I colori stonano: "Usa una tavolozza limitata a due colori, desatura lo sfondo."
- Sembra economico: "Semplifica le forme, riduci l'ingombro, fonte di luce coerente, rimuovi le sfumature."
- Volti inquietanti: "Proporzioni naturali, pori sottili, espressione neutra, scatto medio."
Copia questi nei tuoi prompt di follow-up come se stessi condendo a piacere.
Riferimento rapido: cinque pacchetti di prompt Grok pronti all'uso
- Poster di tecnologia pulita
"Assistente robot futuristico ma amichevole che tiene una clipboard, fotorealistico con illuminazione da studio morbida, sfondo grigio neutro, sottile bagliore blu di accento, composizione centrata, spazio in alto per il titolo, alta definizione, 3:2, nessun testo."
- Scatto di stile di vita di marca accogliente
"Bancone della cucina soleggiato con una tazza di ceramica fumante e un tovagliolo di lino piegato, calda luce dorata, profondità di campo ridotta, grana morbida, toni della terra smorzati, atmosfera calma, spazio negativo a destra, 4:5."
- Illustrazione della copertina del report B2B
"Stack di server isometrico con linee di dati fluenti, sfumatura blu fredda, stile di contorno sottile, distrazioni minime, area del titolo in alto a sinistra, nitido, 16:9."
- Sfondi per carosello social (set di 3)
"Una serie di pannelli sfumati astratti in verde acqua, viola e corallo, curve morbide, texture sottile, spaziatura coerente, minimal, 4:5, nessun testo."
- Macro dettaglio prodotto
"Primo piano macro di una corona di smartwatch nera opaca, luce da studio controllata con roll-off di punti luce morbidi, texture iper-dettagliata, profondità ridotta, alto contrasto, 1:1."
Considerazioni finali: tu sei il regista; Grok è la troupe
Se la generazione di immagini di Grok è la troupe, il tuo prompt è lo storyboard. Dagli una scena, uno stile e alcuni vincoli pratici e lo consegnerà. Divaga come se stessi descrivendo un sogno che ricordi a malapena e otterrai una logica da sogno: dita extra, tazze da tè galleggianti e un procione che vuole parlare con il tuo manager.
Quindi, crea prompt efficaci per le immagini utilizzando la formula, imposta le proporzioni, aggiungi negativi intelligenti e itera con intenzione. Sì, ogni tanto ti capiterà ancora un gatto strano. Ma ora saprai esattamente cosa dire per sistemarlo.
E se vuoi un secondo parere sulle tue parole prima di premere Genera, inseriscile in Sider.AI per una rapida rifinitura. Il tuo gatto, e il tuo pubblico, ti ringrazieranno. FAQ
D1: Qual è il modo più veloce per iniziare con la generazione di immagini di Grok?
Usa una formula breve: scena, soggetto, stile, composizione, illuminazione e proporzioni. Inizia con un prompt pulito, aggiungi "no text/no watermark", genera, quindi modifica una manopola alla volta.
D2: Come posso scrivere prompt efficaci per le immagini senza ottenere immagini disordinate?
Limitati a un singolo soggetto, specifica uno sfondo semplice e definisci la composizione come la regola dei terzi o centrata. Aggiungi negativi come "no busy background, no logos, no borders".
D3: Quali proporzioni devo usare per social, slide o stampa?
Per le storie di Instagram usa 9:16; per banner e slide usa 16:9; per post e schede prodotto usa 1:1 o 4:5. Includi le proporzioni nel tuo prompt per evitare ritagli strani.
D4: Come posso correggere mani o volti strani nelle immagini di Grok?
Usa primi piani medi, specifica "natural proportions" e "realistic skin texture" e tieni le mani lontane da oggetti di scena complessi. Se è ancora sbagliato, rigenera e semplifica la scena.
D5: Quando dovrei rigenerare invece di perfezionare il mio prompt di Grok?
Rigenera quando lo stile o il soggetto sono completamente sbagliati. Raffina quando la base è buona: regola l'illuminazione, la tavolozza dei colori, la composizione o aggiungi prompt negativi chiari.