El problema amb les “imatges d'IA fotorealistes” és que tothom afirma que pot invocar-les amb un *prompt* carregat de *vibe* i una oració. Després es pregunten per què els resultats semblen anuncis de xampú rodats a través d'una patata. El fotorealisme no és un estat d'ànim. És un conjunt de restriccions (lent, llum, sensor, física i una mica de gust), que és exactament el que necessiten els models generatius quan es vol alguna cosa que s'assembli a una foto real.
Aquesta és la fórmula *prompt* per a un fotorealisme veritable en imatges generades per IA. No “cinematogràfic”. No “render Octane”. Real. Com a: pots sentir el gra ISO a les ombres i el vidre està fent el que fa el vidre.
Anem a fer zoom.
La paraula clau sobre la taula: Fórmula *Prompt* per a un fotorealisme veritable en imatges generades per IA
La intenció de l'usuari aquí és dolorosament clara: vols una guia pràctica, no una tesi. Per tant, això és el que és: una fórmula pràctica, més per què funciona. Incorporarem un entramat del món real (distàncies focals, sensors, ràtios d'il·luminació) que els models van aprendre realment i saben imitar. Si vols una il·lustració de fantasia, omet la càmera. Si vols imatges d'IA fotorealistes, especialment cares, productes, entorns, parla càmera.
Sí, hi ha mil llistes que prometen “10 consells per a *prompts* fotorealistes”. Alguns són decents, alguns són *cosplay* per a propietaris de DSLR que mai han tret el dial de mode d'Auto. Unes quantes guies sòlides recorren la configuració de Midjourney i els trucs de *prompt*, i estan bé fins on arriben. Altres cobreixen les idees bàsiques (composició, llum, detalls) sense arribar a una fórmula clara. El quid de la qüestió: com més parles el llenguatge de la fotografia, més es comporta el model com una càmera.
I per si et preguntes si això és fins i tot rellevant per a Sider.AI: la seva eina és una barra lateral d'IA tot en un amb accés als models més recents i un espai de treball *prompt* flexible, cosa que fa que iterar en plantilles *prompt* estructurades i reutilitzables sigui notablement senzill. En altres paraules: un bon lloc per fer això bé. La fórmula: digues-ho com ho diria una càmera
La fórmula *prompt* per a un fotorealisme veritable en imatges generades per IA es redueix a cinc parts:
- Subjecte + Verbs de la realitat
- Llum + Disciplina d'exposició
- Ciència del color + Pel·lícula/Procés
- Restriccions tècniques + Defectes (del tipus bo)
Pots escriure-ho com una sola frase (més net), o com a clàusules separades per comes (més modular). Mostraré ambdues coses.
1) Subjecte + Verbs de la realitat
Les imatges d'IA fotorealistes comencen amb substantius i verbs concrets: “dona lligant-se les sabatilles per córrer sobre asfalt mullat”, no “deessa etèria de la velocitat”. El model coneix “asfalt mullat” millor que coneix la teva poesia. Afegeix indicacions tàctils: “cordons desgastats”, “condensació a l'ampolla d'aigua”, “vapor d'alè a l'aire fred”.
Nucli de subjecte bo:
- “Un *barista* de mitjana edat espumant llet, gerra d'acer inoxidable, remolins de microescuma visibles, concentració als ulls.”
- “Mustang fastback vermell de 1967 aparcat sota un fanal de sodi, pols de carretera tènue, empremtes dactilars al maleter, pluja nocturna.”
2) Càmera + Lent + Sensor
Aquesta és la gran clau. Els models entrenats en fotografia a escala web entenen el llenguatge de la càmera. Especifica:
- Tipus de càmera: “DSLR de fotograma complet”, “sense mirall”, “APS-C”, “format mitjà”.
- Lent i distància focal: “50 mm *prime*”, “85 mm f/1.8”, “24 mm gran angular”, “70–200 mm a 200 mm”.
- Obertura: la profunditat de camp és realisme. f/1.4 enfocament poc profund de somni; f/8 claredat del carrer; f/11 nitidesa del producte.
- Velocitat d'obturació i ISO si el moviment/gra és important.
Exemples:
- “Rodat en una càmera sense mirall de fotograma complet amb 85 mm f/1.8 a f/2.2.”
- “24 mm a f/8, a mà, 1/250s, ISO 400.”
3) Llum + Disciplina d'exposició
La llum és el que fa o desfà. Indica la font, la qualitat i la direcció:
- “Contrallum d'hora daurada, ressaltats de vora, llum clau suau des d'una finestra gran a l'esquerra de la càmera, farciment suau des d'una paret blanca.”
- “Cel ennuvolat, llum superior suau, contrast mínim, sense ombres dures.”
- “Una bombeta de tungstè pràctica al marc, clau/farciment 2:1, lleugera subexposició en 0,3 passos.”
Els models d'IA responen a ràtios, direccions i modificadors com “*softbox*”, “difusió”, “rebot” i “farciment negatiu”.
4) Ciència del color + Pel·lícula/Procés
No només diguis “cinematogràfic”. Demana un *stock* de pel·lícula o característica de processament específica:
- “Paleta Kodak Portra 400, caiguda de ressalt suau.”
- “Color Fujifilm Provia: ombres més fredes, contrast nítid.”
- “Aspecte digital: perfil neutre, tons de pell precisos, sense verd blavós/taronja.”
També especifica les expectatives de balanç de blancs i rang dinàmic:
- “WB de llum diürna 5600K.”
- “Rang dinàmic alt amb compressió de ressalt natural.”
5) Restriccions tècniques + Defectes
Les càmeres reals tenen límits i peculiaritats. Els models també ho aprenen. Afegeix:
- “Vinyetatge de lent natural.”
- “Aberració cromàtica subtil en ressaltats especulars.”
- “Soroll del sensor a ISO 1600 a les ombres.”
- “Desenfocament de moviment a les mans en moviment a 1/60s.”
- “Textura de pell realista, porus visibles, sense suavització de plàstic, sense sobre-nitidesa.”
No estàs sabotejant la imatge, l'estàs fonamentant. Les imperfeccions venen la realitat.
La plantilla *Prompt* compacta
Per a un ús ràpid, aquí teniu la fórmula d'una línia. Omple els claudàtors amb detalls:
. Les guies pràctiques que descriuen els conceptes bàsics de la composició i la il·luminació també ajuden, però la peça que falta sovint és la tolerància tècnica: els defectes i els límits que venen la realitat. Omet aquests i tot sembla un anunci de telèfon intel·ligent: massa net a mitges.
Avançat: pensament de ràtio i microdirecció
- Matemàtiques clau/farciment: si dius “clau/farciment 2:1”, obtindràs una definició suau; “4:1” es llegeix dramàtic; “8:1” és *noir*.
- Llums pràctiques: “llum de tungstè pràctica al marc” indica al model que inclogui una font creïble.
- Microdireccions: “llums de captura a les 10 en punt”, “la llum de la vora separa els cabells del fons”, “ressaltats especulars al crom”. Aquests sonen meticulosos. Ho són. També funcionen.
- Realisme de moviment: no tinguis por del desenfocament de moviment quan tingui sentit: “desenfocament de moviment de la mà de 1/60s”. El real poques vegades està congelat.
- Indicacions ambientals: “bassals amb reflexos dobles”, “empremtes dactilars al vidre”, “partícules de pols a la contrallum”.
El *Prompt* negatiu: treu la brillantor de la nina Barbie
Si la teva eina admet un *prompt* negatiu, utilitza-la per combatre la tendència del model a ser de plàstic fantàstic:
- “Sense pell de plàstic, sense sobre-suavització, sense nitidesa excessiva, sense halos HDR, sense *bloom*, sense il·luminació surrealista, sense dits addicionals.”
- Per a productes: “sense reflexos poc realistes, sense ressaltats impossibles, sense parts flotants, sense distorsions del logotip.”
Composició alfabetitzada amb la càmera
Unes quantes restriccions compositives es llegeixen com “fotògraf real treballant”:
- Distància i enquadrament: “retrat de cap i espatlles”, “tres quarts”, “ampli establidor”, “macro 1:1”.
- Angle: “nivell dels ulls”, “nivell de la cintura”, “pla horitzontal de dalt a baix”, “heroi d'angle baix”.
- Correccions de perspectiva: “verticals mantingudes verticals”, “distorsió de barril lleu permesa.”
- Indicacions de profunditat: “element de primer pla desenfocat”, “subjecte de mig pla”, “fons amb *bokeh* suau”.
Comprovacions de realitat per a cares i pell
La pell és on apareix l'inquietant. Fixa-ho:
- “Textura de pell natural amb porus, pèls vellosos fins, textura lleu sota els ulls.”
- “Dispersió subsuperficial a les orelles a la contrallum.”
- “Petita variació de color a les galtes i el nas (capil·lars).”
- “Sense suavització sense porus, sense ressaltats cerosos.”
Si el teu model tendeix a embellir, sobrecorregeix-lo amb “estil documental”, “llum disponible” i obertures més petites (f/4–f/8). L'encant és un senyal.
Entorns que respiren aire
Interiors: anomena els teus materials i el rebot de la llum. “Pareds pintades mat que absorbeixen la llum”, “especulars de rajoles brillants”, “gra de fusta que atrapa tungstè càlid.”
Exteriors: “boira a la distància”, “perspectiva aèria”, “superfícies humides amb especulars suaus”, “escombraries aleatòries (subtils)”. No és decoració, és física en taquigrafia.
Treball de producte: mode *Control Freak*
Els productes exigeixen restriccions dures:
- “Estable amb trípode, f/11, nitidesa uniforme de vora a vora.”
- “Llum polaritzada per reduir l'enlluernament (o no, si vols brillantor).”
- “Ressaltats especulars controlats amb *flags*.”
- “Perfil neutre de color precís, balanç de blancs personalitzat, sense *color cast*.”
Indica al model la superfície de la taula, l'escombrada de fons i si vols una ombra o un retall flotant.
Un esquema *Prompt* reutilitzable que pots utilitzar realment
Aquí teniu un esquema pràctic que podeu enganxar i editar. Els claudàtors mostren les teves variables; elimina els claudàtors en ús:
.
Resolució de problemes de l'inquietant: què cal solucionar quan és gairebé real
- Massa net? Afegeix gra (“gra ISO 800 a les ombres”), vinyetatge de lent, aberració cromàtica lleu. Retira la saturació. Utilitza un perfil neutre.
- Pell massa brillant? Especifica “sense retocs de bellesa”, “conserva la textura de la pell”, “zona T mat”. Augmenta l'obertura a f/4–f/5.6.
- La il·luminació se sent falsa? Fonamenta-la en una font plausible: “llum de la finestra a l'esquerra de la càmera”, “fluorescent suspès amb *color cast* verd”, “un tungstè pràctic”. Després estableix una ràtio.
- Estranyesa de la perspectiva? Declara la distància focal i l'angle. “50 mm a nivell dels ulls” soluciona molts crims.
- Vores massa nítides? Afegeix “filtre de difusió 1/8” o suavitza el microcontrast. El vidre real té caràcter.
Midjourney, Stable Diffusion, DALL·E: les peculiaritats de la plataforma
- A Midjourney li agraden els adjectius exuberants, però respecta la conversa de la càmera. Mantén la columna vertebral fotogràfica, després guarneix. Les seves pròpies guies impulsen cap a configuracions realistes; només cal vigilar la temptació de sobre-estilitzar. Veuràs molts controladors “—stylize” disfressats de gust. Utilitza'ls amb moderació.
- Stable Diffusion (i SDXL) són al·lèrgics a l'ambigüitat. Les distàncies focals, ISO i *stocks* de pel·lícula exactes juguen bé. Els *prompts* negatius són el teu amic.
- DALL·E tendeix a utilitzar per defecte “catàleg net”. Si vols gra, has d'insistir: gra, halo, vessament direccional, temperatures de color mixtes.
Un recorregut en vídeo pot ajudar-te a veure la causa i l'efecte de cada variable (la il·luminació especialment), però recorda: la majoria de tutorials es desvien cap a l'entrenament estètic en lloc de la fonamentació tècnica. Això últim és el que separa “sembla real” de “sembla IA”.
Uns quants *Prompts* fotorealistes a punt per executar
- Retrat al carrer: “Home amb un abric de pèsols blau marí esperant en un pas de zebra amb pluja lleugera, alè visible, fotografiat amb fotograma complet amb 50 mm a f/2, 1/250s, ISO 800, cel ennuvolat com a llum superior suau, farciment negatiu subtil des de la vora del paraigua negre a la dreta de la càmera, color Portra 400 amb halo suau al voltant dels fanals, gra fi, vinyetatge de lent lleu, enquadrament de tres quarts a nivell dels ulls, reflexos d'asfalt mullat, *bokeh* del trànsit de la ciutat.”
- Primer pla de menjar: “Llesca de pastís de llima clau en un plat de ceràmica amb marques de forquilla, microperles de condensació a l'ompliment, fotografiat amb APS-C amb macro de 60 mm a f/5.6, 1/125s, ISO 200, clau difusa gran des de la finestra a l'esquerra de la càmera, rebot blanc oposat, perfil digital neutre, llum diürna 5600K, nitidesa nítida de vora a vora, molles naturals, ombra suau sobre estovalles de lli, angle de 30° de dalt a baix.”
- Heroi de producte: “Auriculars sense fil negre mat sobre llosa de formigó, marques d'esgarrinxades tènues, fotografiat amb format mitjà amb 80 mm a f/11, 1/160s, ISO 100, dues *softbox* (clau a 45°, vora des de darrere), *flags* per controlar els especulars, perfil de color neutre, microesgarrapades subtils conservades, silueta neta amb ombra suau, composició centrada.”
- Interior documental: “Bar il·luminat tènue amb rètol de cervesa de neó, *barista* netejant el taulell, fotografiat amb fotograma complet amb 35 mm a f/2.8, 1/60s, ISO 1600, barreja de tungstens pràctics i vessament de neó, contrast 4:1, color apagat amb correcció de *color cast* verd, soroll visible a les ombres, desenfocament de moviment lleu a les mans, clients en *bokeh* de fons suau.”
La veritat avorrida que fa millors imatges
El fotorealisme és una disciplina de substracció. No afegeixes realisme, sinó que elimines les ximpleries. Cada clàusula del *prompt* elimina graus de llibertat que el model utilitzaria d'altra manera per al·lucinar. Amb prou restriccions, l'únic que queda és la plausibilitat. I la plausibilitat sembla sospitosament la realitat.
Si això sona poc romàntic, bé, també ho és un fotòmetre. Però pregunta a qualsevol fotògraf que treballa què importa més: la llegenda d'Instagram o la direcció de la llum clau. Exactament.
On les eines ajuden realment (i on no)
Què ajuda:
- Un espai de treball on pots ajustar, versionar i comparar *prompts* costat a costat, mantenint intactes els teus blocs de llenguatge de càmera. La barra lateral de Sider.AI fa això sense fer-te lluitar contra la interfície, cosa que, francament, és un petit miracle en el programari del 2025.
- Iteració ràpida amb *seeds* consistents, perquè sàpigues què ha canviat.
- Canvi de model sense reescriure tot el *prompt*: mantén la columna vertebral fotogràfica, ajusta la guarnició.
Què no ajuda:
- “Paquets de *prompt* màgics” que es llegeixen com a improvisacions. Si no pots explicar què significa “il·luminació quàntica volumètrica hiperreal cinematogràfica”, tampoc ho pot fer el model.
- *Style tokens* ruixats com colònia. Una nota de bon gust és atractiva; un mostrador de mostres de grans magatzems és nàusees.
Una nota dialèctica sobre el gust
El gust és la part del fotorealisme de la qual no parlem perquè no es pot empaquetar. Pots escriure el *prompt* perfecte i encara fer una foto avorrida. La realitat no és inherentment interessant; ser intencional sí que ho és. El llenguatge de la càmera et dóna plausibilitat. Tu aportes el punt de vista.
L'altra cara de la moneda: de vegades “real” no és l'objectiu. De vegades vols alguna cosa que sembli un record: exagerat, indulgent, una mica somiador. Irònicament, la mateixa fórmula t'hi porta: estableix les teves variables i després doblega'n una. Empenyeu l'halo. Inclina el balanç de blancs. Estableix f/1.4 quan hauries d'utilitzar f/5.6. És la “incorrectitud” sobre un teló de fons de correcció el que se sent bé.
El remat
Si vols un fotorealisme veritable en imatges generades per IA, deixa de demanar al model que sigui un artista i comença a demanar-li que sigui una càmera. Sigues específic. Sigues literal. Anomena la teva lent. Declara la teva llum. Abraça una mica de gra. La resta és gust, i cap quantitat de purpurina *prompt* et comprarà això.
Utilitza la fórmula. Després vés a fer alguna cosa que sembli que hi fossis.
FAQ
P1:Quina és la fórmula *prompt* més senzilla per a un fotorealisme veritable en imatges generades per IA?
Subjecte + càmera + lent + exposició + llum + color/pel·lícula + restriccions tècniques + composició + entorn. Parla en termes de càmera (per exemple, 50 mm a f/2, contrallum d'hora daurada) i obtindràs imatges d'IA fotorealistes que realment semblen fotos.
P2:Per què els meus retrats d'IA semblen de plàstic en lloc de fotorealistes?
Estàs deixant que el model prengui per defecte la terra de retocs de bellesa. Especifica una textura de pell realista, porus, pèls fins i prohibeix la sobre-nitidesa o els halos HDR. Afegeix gra i dispara a f/4–f/5.6 per a un fotorealisme més creïble en imatges generades per IA.
P3:Quines configuracions de càmera importen més per a les imatges d'IA fotorealistes?
La distància focal i l'obertura són els senyals més grans: 85 mm a f/2 es llegeix com a retrat; 24 mm a f/8 es llegeix com a carrer/arquitectura. Després d'això, la qualitat i la direcció de la llum. La velocitat ISO i d'obturació ajuden a introduir gra natural i desenfocament de moviment.
P4:Necessito referències de *stock* de pel·lícula per a un fotorealisme veritable?
No, però ajuden. Portra 400, Provia o un perfil digital neutre ofereixen al model un àncora per al color i la caiguda de ressalt. És una drecera cap a una ciència del color plausible en imatges d'IA fotorealistes.
P5:Com ajuda Sider.AI amb el *prompt* fotorealista?
És un lloc ordenat per mantenir un esquema *prompt* reutilitzable, ajustar variables i comparar sortides sense lluitar contra una dotzena de pestanyes. Menys cerimònia, més iteracions: la salsa secreta avorrida per a un fotorealisme veritable en imatges generades per IA.