El dia que el meu robot va dibuixar un gat-gos... i per què les teves indicacions són importants
Alguna vegada li has demanat a una IA que dibuixi un gat i t'ha tornat alguna cosa que sembla un mapache fent una audició per a un anunci de xampú? Sí, m'ha passat. La generació d'imatges de Grok pot ser brillant—digne d'un pòster, fins i tot—però només si li parles com un director que realment sap el que vol. La màgia no és només en el model. Està en la teva indicació. I avui arreglarem les teves indicacions perquè Grok deixi de produir patates Picasso i comenci a enviar visuals de qualitat de galeria.
Atenció: aquesta és una guia pràctica amb fórmules d'indicacions reals, exemples i errors comuns. Al final, sabràs com utilitzar la generació d'imatges de Grok, crear indicacions efectives per a visuals i obtenir realment la imatge que volies, no la que el teu cosí robot va entendre malament.
Grok Image Generation 101: Què és, què no és i per què de vegades dibuixa massa dits
La generació d'imatges de Grok funciona com un assistent d'estudi que escolta molt atentament, i després improvisa salvatgement si deixes massa espai. Tradueix les teves descripcions de text en imatges coincidint amb patrons que ha après. Pensa: “Descriu l'escena, l'estil, l'ambient i els detalls tècnics”, i Grok construeix els píxels.
Revisió important de la realitat:
- Com més específica sigui la teva indicació, més fidel serà el resultat.
- L'estil, la il·luminació, l'angle de la càmera—aquests importen més del que creus.
- Les cares, les mans i el text encara poden ser complicats. Planifica reintents i iteracions.
Si vols una portada d'àlbum, no diguis “portada d'àlbum”. Digues: “composició atrevida i d'alt contrast de portada d'àlbum, subjecte centrat, textura de pel·lícula granulada, il·luminació posterior dramàtica, àrea de text de títol a la part superior”. Veus la diferència? Tu ets el director. Grok és l'equip.
La fórmula: Com escriure indicacions de Grok que realment funcionin
Aquí tens una fórmula d'indicació senzilla que converteix el caos en art:
Escena + Subjecte + Estil + Composició + Il·luminació + Color + Càmera + Ambient + Qualitat + Restriccions
Desglossem-ho—estil amigable per a Grok.
- Escena: On som? A l'interior, a l'exterior, a Mart, en una petita cuina de Nova York?
- Subjecte: Qui/què? Sigues específic. “Un patinet Vespa vermell vintage” és millor que “un patinet”.
- Estil: Il·lustració, fotorealista, aquarel·la, inspirat en Studio Ghibli (evita copiar artistes pel seu nom si no és possible), cyberpunk, minimalista.
- Composició: Primer pla, pla mitjà, pla general; centrat, regla dels terços; espai negatiu per al text.
- Il·luminació: Llum suau del matí, retroil·luminació de neó, hora daurada, cinematogràfica.
- Color: La paleta de colors importa: pastel, monocrom, duotò, saturat.
- Càmera: Objectiu de 35 mm, macro, aeri, angle baix, bokeh f/1.8.
- Ambient: Calmat, capritxós, ominós, enèrgic.
- Qualitat: 4K, alt detall, focus nítid, agut.
- Restriccions: Sense text, sense filigrana; subjecte únic; simètric; relació d'aspecte.
Consell professional: No escriguis una novel·la. Escriu una descripció de l'escena. Apunta a 1–3 frases més uns quants paràmetres estructurats.
Canvis d'imatge d'indicacions: De vagues a Vogue
Indicació dolenta: “Un gat.”
Indicació millor: “Gat tigrat taronja descansant en un ampit de finestra, fotorealista, llum suau del matí, poca profunditat de camp, objectiu de 50 mm, paleta de colors pastel càlida, ambient tranquil, alt detall, subjecte únic, 3:2.”
Indicació dolenta: “Ciutat a la nit.”
Indicació millor: “Carrer cyberpunk de Tòquio a la nit, reflexos de neó sobre paviment mullat, angle ultraample, alt contrast, il·luminació cinematogràfica, blaus i magentas profunds, desenfocament de moviment de multitud bulliciosa, alt detall, 16:9.”
Indicació dolenta: “Fes un logo.”
Indicació millor: “Emblema minimalista d'estil vectorial per a una aplicació de senderisme, silueta estilitzada de muntanya amb un sender, disseny pla, paleta de dos colors (verd bosc i crema), composició centrada, sensació de fons transparent, sense text, alt contrast, quadrat.”
Veus el patró? Context + estil + restriccions. Grok no pot llegir la teva ment. Encara.
Com utilitzar la generació d'imatges de Grok: Un ràpid pas a pas
- Decideix el teu objectiu: publicació social, bàner publicitari, maqueta de producte, portada de presentació, tauler d'inspiració.
- Escriu una primera versió de la indicació utilitzant la fórmula.
- Afegeix restriccions: relació d'aspecte, subjecte únic, notes de composició, sense text si penses afegir-lo més tard.
- Genera. Respira. Resisteix el reflex de pànic de regenerar 47 vegades.
- Revisa i itera amb un canvi cada vegada. No llencis tota la casa per la finestra a la segona indicació.
Exemple d'iteració:
- Primera indicació: “Cappuccino fotorealista sobre una taula de marbre, vista des de dalt, cor d'art latte, llum natural suau, paleta neutra, 4K, 1:1.”
- Resultat massa fosc? Seguiment: “Augmenta lleugerament l'exposició, afegeix ressaltats més càlids.”
- L'escuma té un aspecte estrany? “Textura d'escuma més nítida, art latte més clar, redueix el gra.”
Tracta-ho com una conversa amb un becari de disseny molt literal que està fent tot el possible.
Els blocs de construcció visuals: Estils, il·luminació, objectius i composició
- Estils que Grok entén bé: fotorealisme, rentat d'aquarel·la, vector pla, render 3D, isomètric, pòster retro, mitja tinta de còmic, low-poly.
- Indicacions d'il·luminació que importen: hora daurada (brillantor càlida), softbox (il·luminació uniforme), il·luminació de vora (vores del subjecte dramàtiques), neó (alt contrast, colors saturats), clarobscur (malhumorat, ric en ombres).
- Lents i llenguatge de càmera: 24 mm per a escenes amples; 50 mm per a perspectiva natural; 85 mm per a retrats; macro per a detalls; f/1.8 per a bokeh; aeri/dron per a vista des de dalt.
- Guia de composició: regla dels terços per a trets equilibrats; simetria central per a pòsters atrevits; espai negatiu per a superposicions; primer pla per a detalls del producte; pla general per a l'entorn.
Afegeix dos o tres d'aquests per indicació. No tots. Estàs fent un plat, no una explosió d'especies.
Plantilles d'indicacions que pots robar (si us plau, fes-ho)
- Imatge heroïna del producte: “Rellotge intel·ligent elegant d'acer inoxidable sobre una superfície negra mat, il·luminació d'estudi fotorealista amb reflexos suaus, objectiu de 85 mm, poca profunditat de camp, composició centrada, alt detall, espai a la part superior per al titular, 4:5.”
- Foto d'estil de vida: “Jove viatger creuant un pas de zebra sota una pluja lleugera, paviment reflectant, desenfocament de moviment, estil de fotografia de carrer espontània, paleta apagada, objectiu de 35 mm, llum natural, regla dels terços, 16:9.”
- Il·lustració: “Il·lustració d'un racó de lectura acollidor, càlides prestatgeries de fusta, plantes, un gat tigrat enroscat en una cadira, estil vectorial pla amb gra texturat, paleta terrosa, resplendor ambiental suau, contorns nets, 1:1.”
- Fons d'anunci social: “Patrons de ones degradades abstractes, duotò verd blau i violeta, corbes suaus, soroll visual mínim, ampli espai negatiu a la dreta, nítid, 16:9.”
- Portada de presentació: “Horitzó urbà minimalista modern a l'alba, cel suau degradat pastel, estil de línia fina, composició ampla amb una àrea de títol clara a la part superior esquerra, alta resolució, 16:9.”
Copia, enganxa, retoca. No és enganyar. És eficient.
L'anatomia d'una indicació de Grok efectiva (anotada)
Indicació: “Retrat fotorealista d'una corredora de marató lligant-se la sabata a la sortida del sol, retroil·luminació d'hora daurada, alè visible a l'aire fresc, objectiu de 85 mm, poca profunditat de camp, ressaltats càlids, ombres suaus, alt detall, subjecte únic, espai negatiu a l'esquerra per al text, 4:5.”
Per què funciona:
- Subjecte i acció clars (corredora lligant-se la sabata)
- Temps i llum (sortida del sol, retroil·luminació d'hora daurada)
- Càmera i composició (85 mm, DoF, espai negatiu a l'esquerra)
- Ambient i textura (alè a l'aire fresc, ressaltats càlids)
- Restricció pràctica (relació d'aspecte per al pòster)
Arreglar els quatre grans problemes (i les indicacions que et salven)
- Consell: Utilitza plans mitjans en lloc de primers plans extrems. Afegeix “proporcions naturals, simetria facial neta, textura de pell realista” i mantén les mans lluny d'accessoris complexos.
- Exemple: “Retrat de pla mitjà, proporcions naturals, textura de pell realista, mans retallades, llum clau suau, fons neutre.”
- Text o filigranes no desitjats
- Consell: Digues “sense text, sense filigrana, fons net”. Si necessites text, afegeix-lo més tard en una eina de disseny.
- Exemple: “Conjunt d'icones vectorials planes, amples de traç uniformes, sense text, sense filigrana, aspecte transparent, quadrícula de disseny quadrada.”
- Consell: Limita el recompte de subjectes. Especifica “subjecte únic” o “fons mínim”.
- Exemple: “Un sol arbre bonsai sobre una pedra llisa, entorn d'estudi minimalista, il·luminació superior suau, poca profunditat, espai negatiu, 3:2.”
- Mashups d'estils/èpoques incorrectes
- Consell: Sigues explícit sobre la dècada i l'estil. Digues “aspecte de pel·lícula en color dels anys 70” en lloc de només “retro”.
- Exemple: “Estètica de pel·lícula en color dels anys 70, gra subtil, colors lleugerament esvaïts, vinyeta suau, escena de carrer espontània, objectiu de 35 mm.”
Relacions d'aspecte: Perquè la teva història d'Instagram i la teva presentació de diapositives no comparteixen pantalons
- Quadrat (1:1): rajoles de producte, avatars, quadrícules netes.
- Retrat (4:5 o 9:16): Publicacions i històries d'Instagram, anuncis per a mòbils.
- Horitzontal (16:9): miniatures de YouTube, diapositives, bàners heroïns.
- Apta per a la impressió (3:2, 4:3): pòsters, fullets.
Afegeix la relació a la teva indicació. Evita el retall incòmode més tard.
Estratègia d'iteració: La regla d'“Un pom cada vegada”
Quan Grok no encerta, resisteix la temptació de reescriure-ho tot. Canvia una cosa per iteració:
- Retoc d'il·luminació: “Canvia a llum ennuvolada suau.”
- Retoc de composició: “Canvia a la regla dels terços, subjecte a la dreta.”
- Retoc de color: “Utilitza una paleta pastel apagada.”
- Retoc d'estil: “Canvia a il·lustració vectorial plana.”
Per què? Perquè si canvies cinc coses i la imatge millora, no sabràs quin retoc va fer el truc. No només estàs fent una imatge—estàs aprenent com Grok t'escolta.
Restriccions creatives: La salsa secreta per a la consistència
Vols una imatge de marca consistent a través d'una campanya? Crea una mini guia d'estil dins de la teva indicació:
- “Tons terra apagats, textura de gra suau, vinyeta suau, composició centrada, ombra subtil sota el subjecte, espai per al titular serif a la part superior esquerra, 4:5.”
Després, reutilitza i només canvia el subjecte. És com fer plantilles, però més genial.
Indicacions per a persones vs. productes vs. llocs
- Persones: Especifica rang d'edat, vestimenta, posició, emoció i entorn. Utilitza “proporcions naturals” i “textura de pell subtil”. Mantén les mans senzilles.
- Productes: Descriu el material, l'acabat (mat, brillant), els reflexos, l'entorn, l'objectiu i una superfície neta. La il·luminació d'estudi fa meravelles.
- Llocs: Defineix l'hora del dia, el clima, el nivell d'activitat i la paleta de colors. Afegeix l'angle de la càmera i la longitud focal.
Exemples ràpids:
- Persones: “Retrat d'un xef de mitjana edat amb una bata blanca, fons de cuina càlid, llum clau suau, objectiu de 85 mm, expressió natural, poca profunditat, alt detall, 3:2.”
- Productes: “Auriculars sense fil negres mat sobre una llosa de formigó, il·luminació de vora d'estudi per a les vores, focus nítid, fons mínim, centrat, 4K, 1:1.”
- Llocs: “Bosc de pins boirós a l'alba, paleta freda de color blau-verd, perspectiva d'angle baix mirant cap amunt, llum volumètrica suau, alt detall, 16:9.”
Creació d'indicacions efectives per a visuals amb referències (quan afegir imatges)
Si pots adjuntar imatges de referència, fes-ho—amb moderació. Una o dues referències ajuden a Grok a fixar un aspecte o una posició. Afegeix una breu directiva textual per decidir què seguir:
- “Coincideix amb la il·luminació de la referència A; utilitza la paleta de colors de la referència B; mantén la composició centrada; sense text.”
Si no pots afegir referències, utilitza indicacions “com”: “gra de pel·lícula suau”, “paleta apagada semblant a Kodak”, “estil de plànol isomètric”. És el tauler d'inspiració en paraules.
Indicacions negatives: Digues-li a Grok què no ha de fer
Grok de vegades s'insereix “útilment” accessoris, textures o text addicionals. Atura-ho amb negatius:
- “Sense text, sense filigrana, sense membres addicionals, sense fons ocupat, sense logotips, sense vores.”
Mantén-ho curt i consistent. Els negatius són els cinturons de seguretat de la teva indicació—molestos fins que els necessites.
La comprovació d'indicació de deu segons (abans de prémer Generar)
Pregunta't:
- Pot un desconegut imaginar aquesta escena a partir de les meves paraules?
- He especificat l'estil, la il·luminació i la composició?
- He establert la relació d'aspecte i el recompte de subjectes?
- He inclòs negatius per a problemes comuns?
- He evitat paraules vagues com “genial” i “agradable”? (El teu informe de llibre de l'escola secundària ha trucat. Vol que li tornis els adjectius.)
Si és que sí, genera.
Casos d'ús del món real: Indicacions de Grok per a treballs comuns
- Bàner de màrqueting: “Disseny minimalista heroï de producte per a un sèrum per a la cura de la pell, ampolla de vidre amb un acabat glaçat sobre una rajola de ceràmica blanca brillant, llum d'estudi difusa suau, ombra subtil, espai per al titular a la dreta, alt detall, 16:9, sense text.”
- Miniatura de YouTube: “Il·lustració fotogràfica atrevida i d'alt contrast d'un ordinador portàtil que explota amb icones de neó, fons fosc, subjecte central, il·luminació de vora dramàtica, composició neta, espai negatiu de grans dimensions per al títol, 16:9.”
- Fons de captures de pantalla de la botiga d'aplicacions: “Formes geomètriques abstractes, degradats suaus en verd blau i corall, profunditat suau amb ombres paral·leles, distracció mínima, 9:16.”
- Portada d'informe intern: “Il·lustració isomètrica neta d'un bastidor de centre de dades, blaus i grisos freds, resplendor subtil, contorns prims, espai per al títol a la part superior esquerra, 4:3.”
- Art de pòster d'esdeveniment: “Horitzó retrofuturista amb cotxes voladors, degradat de color de posta de sol, estil vectorial nítid, composició centrada, formes de silueta atrevides, 3:2.”
Quan regenerar vs. quan refinar
- Regenera si: tot l'ambient va fallar—estil incorrecte, subjecte incorrecte, època incorrecta.
- Refina si: els ossos són bons—mantén el nucli i ajusta la il·luminació, el color o la composició.
Pensa en regenerar com començar una nova recepta; refinar com afegir més sal. O, per als que no cuinen, canviar de “fort incorrecte” a “correcte amb retocs”.
Val la pena destacar: Utilitzar Sider.AI per clavar les indicacions més ràpidament
Si estàs provant moltes indicacions i no tens temps per ser un xiuxiuejador d'IA a temps complet, Sider.AI pot ser l'amic útil que és bo amb les paraules. Enganxa la teva indicació aproximada i demana-li que optimitzi per a la generació d'imatges de Grok amb restriccions estilístiques, indicacions negatives i relacions d'aspecte. Escopirà una versió ajustada i llesta per executar més ràpid del que pots dir, “Per què aquest gat té cinc orelles?” És especialment útil per a equips que necessiten indicacions de marca consistents a través de les campanyes. Moviments avançats: Consistència de múltiples trets i aspectes de sèrie
- Consistència de caràcter: Descriu trets i roba repetibles i bloqueja la il·luminació i l'objectiu. Exemple: “Mateix caràcter: cabell castany arrissat curt, ulleres rodones, dessuadora amb caputxa de color blau marí; llum de finestra de llum natural; objectiu de 50 mm; gra suau; fons neutre.” Reutilitza a través de les indicacions.
- Llenguatge de color: Defineix indicacions similars a hex en paraules: “verd bosc profund, crema càlida, terracota apagada.”
- Continuïtat de la textura: “Gra de paper subtil, vinyeta lleugera, ombres suaus” a través de totes les imatges manté una col·lecció cohesiva.
- Ritme de composició: Alterna primers plans, mitjans i generals per explicar una història en una sèrie.
Taula de resolució de problemes sense la taula (perquè, disseny)
- Massa nítid o plastificat: “Redueix lleugerament la claredat, afegeix gra suau, ressaltats més càlids.”
- Massa pla: “Augmenta el contrast, afegeix llum de vora, aprofundeix les ombres.”
- Els colors xoquen: “Utilitza una paleta limitada de dos colors, dessatura el fons.”
- Sembla barat: “Simplifica les formes, redueix el desordre, font de llum consistent, elimina els degradats.”
- Cares inquietants: “Proporcions naturals, porus subtils, expressió neutra, pla mitjà.”
Copia això a les teves indicacions de seguiment com si estiguessis condimentant al gust.
Referència ràpida: Cinc paquets d'indicacions de Grok llestos per utilitzar
- Pòster de tecnologia neta
“Assistent robòtic futurista però amigable subjectant un porta-retalls, fotorealista amb il·luminació d'estudi suau, fons gris neutre, resplendor d'accent blau subtil, composició centrada, espai a la part superior per al titular, alt detall, 3:2, sense text.”
- Tret d'estil de vida de marca acollidor
“Comptador de cuina assolellat amb una tassa de ceràmica fumant i un tovalló de lli plegat, llum daurada càlida, poca profunditat de camp, gra suau, tons terra apagats, ambient tranquil, espai negatiu a la dreta, 4:5.”
- Il·lustració de portada d'informe B2B
“Pila de servidors isomètrica amb línies de dades fluint, degradat blau fred, estil de contorn prim, distraccions mínimes, àrea de títol a la part superior esquerra, nítid, 16:9.”
- Fons de carrusel social (conjunt de 3)
“Una sèrie de panells degradats abstractes en verd blau, violeta i corall, corbes suaus, textura subtil, espaiat consistent, mínim, 4:5, sense text.”
- Macro de detall del producte
“Macro de primer pla d'una corona de rellotge intel·ligent negra mat, llum d'estudi controlada amb un roll-off de ressalt suau, textura hiperdetallada, poca profunditat, alt contrast, 1:1.”
Presa final: Tu ets el director; Grok és l'equip de càmera
Si la generació d'imatges de Grok és l'equip de càmera, la teva indicació és el guió gràfic. Dona-li una escena, un estil i unes quantes restriccions pràctiques, i ho complirà. Dispara com si estiguessis descrivint un somni que gairebé no recordes, i obtindràs lògica de somni: dits addicionals, tasses de te flotants i un mapache que vol parlar amb el teu mànager.
Per tant, crea prompts visuals efectius utilitzant la fórmula, defineix la relació d'aspecte, afegeix negatius intel·ligents i itera amb intenció. Sí, encara obtindràs un gat estrany de tant en tant. Però ara sabràs exactament què dir per solucionar-ho.
I si vols una segona opinió sobre les teves paraules abans de prémer Genera, posa-les a Sider.AI per a una repassada ràpida. El teu gat—i el teu públic—t'ho agrairan. FAQ
P1: Quina és la manera més ràpida de començar amb la generació d'imatges de Grok?
Utilitza una fórmula curta: escena, subjecte, estil, composició, il·luminació i relació d'aspecte. Comença amb un prompt net, afegeix "sense text/sense marca d'aigua", genera i, després, modifica un paràmetre cada vegada.
P2: Com puc escriure prompts visuals efectius sense obtenir imatges desordenades?
Limita't a un sol subjecte, especifica un fons senzill i defineix la composició com ara la regla dels terços o centrada. Afegeix negatius com ara "sense fons recarregat, sense logotips, sense vores".
P3: Quina relació d'aspecte he d'utilitzar per a xarxes socials, diapositives o impressió?
Per a les històries d'Instagram, utilitza 9:16; per a banners i diapositives, utilitza 16:9; per a publicacions i fitxes de producte, utilitza 1:1 o 4:5. Inclou la relació d'aspecte al teu prompt per evitar retallades incòmodes.
P4: Com puc solucionar mans o cares estranyes a les imatges de Grok?
Utilitza plans mitjans, especifica "proporcions naturals" i "textura de pell realista" i mantén les mans allunyades d'atrezzo complex. Si encara no funciona, torna a generar i simplifica l'escena.
P5: Quan he de regenerar en lloc de refinar el meu prompt de Grok?
Regenera quan l'estil o el subjecte siguin completament incorrectes. Refina quan la base sigui bona: ajusta la il·luminació, la paleta de colors, la composició o afegeix prompts negatius clars.