สิ่งที่เกี่ยวกับเครื่องมือสร้างภาพ AI คือทุกคนแสร้งทำเป็นว่าต้องการ “ความสมบูรณ์แบบเหมือนจริง” จนกว่าโมเดลจะทำในสิ่งที่พวกเขาต้องการจริงๆ ได้อย่างเชี่ยวชาญ: รสนิยม และรสนิยม — ไม่ใช่ความเร็ว ไม่ใช่เมกะพิกเซล ไม่ใช่พรอมต์ที่มีไวยากรณ์รูน — คือจุดที่การต่อสู้เกิดขึ้น
มาถามคำถามที่ชัดเจนที่สุดก่อน หากเครื่องมือสร้างภาพ AI ดีมากแล้ว ทำไมภาพจำนวนมากยังคงดู… แปลกๆ? ไม่ใช่ว่าผิด แต่แค่แปลกไปเล็กน้อย เหมือนพิพิธภัณฑ์หุ่นขี้ผึ้งที่แสงไฟดีมาก แต่ดวงตากลับมองตามคุณช้าไปหนึ่งวินาที ช่องว่างนั้น — ระหว่างสิ่งที่เราบอกว่าเราต้องการกับสิ่งที่เรายอมรับ — คือสิ่งที่ฉากทั้งหมดนี้ขับเคลื่อน
สิ่งที่ชัดเจนคือ: เครื่องมือสร้างภาพ AI นั้นรวดเร็ว ยืดหยุ่น และน่าทึ่งอย่างตรงไปตรงมา และพวกมันกำลังพัฒนาในสิ่งหนึ่งที่คอมพิวเตอร์ควรจะทำได้แย่มากที่สุด: ทำในสิ่งที่เราตั้งใจ ไม่ใช่สิ่งที่เราพูด ส่วนที่สองยังคงลื่นไหล หากคุณเคยดำดิ่งลงไปในหลุมกระต่ายของ “ทำไมมันถึงไม่ใส่ข้อความบนป้ายโดยไม่ทำให้ตัวอักษรละลาย” คุณจะรู้สึกถึงมัน
เราอยู่ระหว่างยุคกล้องดิจิทัลยุคแรกๆ กับช่วงเวลาที่สมาร์ทโฟนทำให้การถ่ายภาพกลายเป็นพลังพิเศษในชีวิตประจำวัน โมเดลสามารถแสดงรูขุมขนที่ทำให้แพทย์ผิวหนังของคุณต้องอาย และพวกมันสามารถพ่นภาพต่างๆ ออกมาได้ถึงหกรูปแบบก่อนที่คุณจะพูดคำว่า “สุนทรียภาพ” ได้ แต่เรื่องราวที่แท้จริงไม่ใช่ความสมจริงระดับพื้นผิว มันคือการควบคุม ความสอดคล้อง และรสนิยม
สิ่งที่ผู้คนต้องการจริงๆ จากเครื่องมือสร้างภาพ AI
- ปุ่มควบคุมที่ชัดเจน: การลงสี การขยายภาพ การล็อคสไตล์ ความสอดคล้องของ Seed อัตราส่วนภาพที่ไม่ทำหน้าที่เหมือนคำแนะนำ
- ความสามารถในการคาดการณ์ได้: พรอมต์เดียวกัน ทิศทางเอาต์พุตเดียวกัน ไม่ใช่การทอยลูกเต๋าด้วยเอนโทรปีที่สวยงาม
- การเคารพข้อจำกัด: การพิมพ์ที่อ่านง่าย มือที่เป็นของมนุษย์ แสงที่ไม่ทรยศต่อฟิสิกส์
- ความชัดเจนทางกฎหมายและการอนุญาตให้ใช้สิทธิ์: ไม่มีการเสี่ยงโชคเรื่องลิขสิทธิ์
- ขั้นตอนการทำงานที่ไม่ต้องใช้วุฒิบัตรโบราณคดี Discord
ในทางทฤษฎี พื้นที่นี้ดูเหมือนแออัด ในทางปฏิบัติ เครื่องมือหลักแต่ละอย่างเผยให้เห็นความคิดเห็นที่แตกต่างกันเกี่ยวกับความรู้สึกของการสร้างภาพควรเป็นอย่างไร
- Midjourney: มูดบอร์ดของผู้กำกับ Uncanny ดีในด้านสไตล์และองค์ประกอบ ยังคงดูลึกลับเล็กน้อยในการควบคุม คุณทำงานกับ Midjourney ไม่ใช่บน Midjourney
- DALL·E 3: เชื่อฟังภาษาธรรมชาติและคำบรรยายอย่างไม่มีที่ติ เป็นนักเรียนเกรด A: ทำตามคำแนะนำได้ดี บางครั้งก็ตรงไปตรงมาเกินไป
- Stable Diffusion และ SDXL/SD3.x: โรงรถของนักประดิษฐ์ เปิด ปรับเปลี่ยนได้ มีความสามารถอย่างมากในมือที่ถูกต้อง อันตรายหากคุณไม่รู้ว่าจะดึงคันโยกใด ตอบแทนหากคุณทำ
- Adobe Firefly: ผู้ใหญ่ขององค์กร ราวกั้นความปลอดภัย ใบอนุญาตทางการค้า ความช่วยเหลือพิเศษของ “ใช่ ฝ่ายกฎหมายอนุมัติแล้ว”
จุดร่วม: เครื่องมือสร้างภาพ AI เป็นตัวขยายรสนิยม พวกเขาช่วยให้ผู้ที่ไม่ใช่นักศิลปะสามารถถ่ายทอดวิสัยทัศน์ได้ แต่พวกเขายังคงให้รางวัลแก่คุณธรรมที่น่าเบื่อเหมือนเดิม: การทำซ้ำ การแก้ไข และสายตา
พรอมต์ไม่ใช่คาถา มันคือ Brief
นิสัยที่แย่ที่สุดของอุตสาหกรรมคือการแสร้งทำเป็นว่าพรอมต์เป็นความลับ ความจริงก็คือมันใกล้เคียงกับการเขียน Brief ที่สร้างสรรค์ที่ดีมากกว่า คุณไม่จำเป็นต้องมีคำวิเศษณ์บาโรกและศิลปินที่คั่นด้วยเครื่องหมายจุลภาคสามโหล คุณต้องมี:
- ความชัดเจนของหัวเรื่อง: อะไรอยู่ในเฟรม อะไรไม่อยู่ ผู้ชมควรสังเกตอะไรก่อน
- บริบทและข้อจำกัด: เวลาของวัน สไตล์แสง ความรู้สึกของเลนส์ (กว้าง vs เทเล) ยุค สื่อ อารมณ์
- คำแนะนำองค์ประกอบ: พื้นหน้า vs พื้นหลัง ความสมมาตร พื้นที่ว่าง ข้อความควรอยู่ที่ไหน
- สิ่งที่ต่อรองไม่ได้: “ห้านิ้ว” ป้ายที่อ่านง่าย ความเที่ยงตรงของสีแบรนด์
ปฏิบัติต่อโมเดลเหมือนนักออกแบบรุ่นน้อง: เฉพาะเจาะจงพอที่จะรับผิดชอบได้ เปิดกว้างพอสำหรับตัวเลือกต่างๆ จากนั้นทำซ้ำ ภาพแรกแทบจะไม่ใช่ผู้รักษา ภาพที่สองมักจะเป็น ภาพที่สามบางครั้งพลิกแนวคิด
ความสมจริง vs รสนิยม (เลือกรสนิยม)
Photorealism เป็นลูกเล่นในห้องนั่งเล่น มันทำให้เราทึ่ง ตอนนี้เราคาดหวังมัน สิ่งที่ขับเคลื่อนเข็มคือรสนิยม นี่คือเหตุผลที่ภาพ Midjourney สามารถดูเหมือนภาพยนตร์ได้แม้ว่าพวกเขาจะได้รับรายละเอียดผิด — โมเดลมีอคติต่อสุนทรียภาพ ช่างภาพและนักวาดภาพประกอบกำหนดรสนิยมโดยสัญชาตญาณ AI กำหนดโดยความน่าจะเป็นก่อนหน้า นั่นไม่ใช่ข้อผิดพลาด มันคือคุณสมบัติ คำถามคือรสนิยมของโมเดลทับซ้อนกับของคุณหรือไม่
คุณสามารถต่อสู้กับ priors ได้ หรือคุณสามารถโต้คลื่นได้ ผู้ที่ได้รับผลลัพธ์ที่ดีไม่ได้บังคับให้โมเดลเข้าสู่ศาสนาอย่างแข็งขัน พวกเขาปรับพรอมต์ของพวกเขาให้เข้ากับกระแส ขอโปสเตอร์ Saul Bass และต่อสู้เพื่อความเรียบง่ายที่หยาบกร้าน คุณจะไปถึงที่นั่นได้เร็วกว่าการเริ่มต้นจาก “ทำโปสเตอร์ที่เรียบง่ายให้ฉัน” และดึงโมเดลออกจาก “modern glossy gradient mush”
การพิมพ์ยังคงเป็น Canary
ถามนักออกแบบคนใดก็ได้: หากแบบอักษรดูผิด ภาพทั้งหมดจะดูผิด ปัญหาการจัดการข้อความของ AI ได้รับการปรับปรุงจาก “ซุปตัวอักษรที่มีแขนพิเศษ” เป็น “เกือบถูกถ้าคุณไม่มองใกล้เกินไป” มันดีกว่า — ใช้งานได้ด้วยซ้ำ — ในเลย์เอาต์ที่โมเดลเคารพพื้นที่ว่างเปล่า แต่เรายังไม่ได้อยู่ที่ “drop-in headline ready” ในทุกกระดาน เมื่อคุณต้องการการพิมพ์ที่แน่นหนา วิธีแบบเก่า (คุณ แบบอักษรจริง และเครื่องมือจัดวาง) ยังคงชนะ
และนี่ก็โอเค เพราะกรณีการใช้งานที่ยอดเยี่ยมสำหรับเครื่องมือสร้างภาพ AI ไม่ใช่การพิมพ์ขั้นสุดท้าย มันคือการสร้างแนวคิด มันคือ comps ที่ไม่ทำให้คุณอับอาย มันกำลังผลักดันผ่านหน้าว่างเปล่า งานที่ดีที่สุดที่ฉันเคยเห็นจับคู่ AI กับบรรณาธิการที่เป็นมนุษย์ที่แพ้รายละเอียดที่ขี้เกียจ
Inpainting, Outpainting และภาพลวงตาของการควบคุม
เครื่องมือต่างๆ ชอบขายการควบคุม ความเป็นจริง: การลงสีและการขยายภาพนั้นไม่เหมือนเครื่องมือผ่าตัด แต่เหมือนดนตรีแจ๊สด้นสดด้วยมีดผ่าตัด พวกเขาทำงานได้อย่างสวยงามเมื่อคุณกำลังกระตุ้น: ลบโคมไฟ เพิ่มท้องฟ้า ขยายชุด พวกเขาประหม่ากับการแก้ไขโครงสร้างที่ขัดแย้งกับตรรกะของฉาก เคล็ดลับคือการคิดเหมือนช่างภาพยนตร์ รักษาสภาพเดิม: มุม ทิศทางแสง สเกล หากดวงอาทิตย์เปลี่ยนไป 30 องศาระหว่างการลงสี ผู้ชมจะรู้สึกถึงมัน แม้ว่าพวกเขาจะไม่สามารถอธิบายได้ว่าทำไม
Negative prompts ยังคงมีประโยชน์ แต่เช่นเดียวกับพื้นที่ว่างทั้งหมด พวกเขาอ่านได้ดีขึ้นเมื่อใช้แต่น้อย “No extra fingers” นั้นใช้ได้ รายการซักรีดของ “no this, no that” เปลี่ยนเครื่องกำเนิดไฟฟ้าให้เป็นหุ้นส่วนการแสดงด้นสดที่รู้สึกผิด บอกให้ทำอะไร ไม่ใช่แค่สิ่งที่จะหลีกเลี่ยง
ความเป็นจริงทางกฎหมาย: ใบอนุญาตและลายน้ำ
นี่คือส่วนที่ทุกคนแสร้งทำเป็นว่าน่าเบื่อจนกว่าลูกค้าจะขอแหล่งที่มา หากคุณกำลังสร้างงานเชิงพาณิชย์ คุณต้องมีความชัดเจน: ข้อมูลคืออะไร ใบอนุญาตคืออะไร จะเกิดอะไรขึ้นหากมีคนร้องเรียน โมเดลที่เชื่อมโยงกับสต็อกหรือใบอนุญาตองค์กรที่ชัดเจนจะยังคงชนะข้อตกลง ไม่ใช่เพราะพวกเขาเป็นศิลปินที่ดีกว่า แต่เป็นเพราะพวกเขามาพร้อมกับเอกสาร อีกส่วนหนึ่งคือที่มา — ข้อมูลประจำตัวเนื้อหาเข้ารหัส ลายน้ำ ซุปตัวอักษรทั้งหมดนั้น พวกเขาจะไม่หยุดผู้กระทำผิด พวกเขาจะช่วยให้ทีมที่ซื่อสัตย์พิสูจน์สิ่งที่อะไรเป็นอะไร
สำหรับผู้สร้างแต่ละราย เส้นทางที่เป็นประโยชน์จริงง่ายกว่า: เก็บเลเยอร์ของคุณ เก็บ Seeds ของคุณ เก็บพรอมต์ของคุณ บันทึกกระบวนการของคุณ มันไม่เย้ายวนใจ แต่มันคือข้อแก้ตัวของคุณ
ขั้นตอนการทำงาน: เครื่องมือสร้างภาพ AI เหมาะสมกับที่ใด
- Brainstorming: ระเบิดผ่าน 20 ทิศทางใน 15 นาที และฆ่า 18 ทิศทางโดยไม่รู้สึกผิดเลย
- Moodboards: รวมรูปลักษณ์ก่อนที่ใครจะโต้แย้งเกี่ยวกับกล้องที่คุณไม่ได้เป็นเจ้าของ
- Comps: แสดงเลย์เอาต์ด้วยแสงที่สมจริงและมุมมองที่น่าเชื่อ
- Variations: a/b ทดสอบจานสี โพสท่า สภาพแวดล้อมโดยไม่ต้องถ่ายใหม่
- Post tricks: ลงสีองค์ประกอบที่คุณลืมบนชุด ขยายเฟรม แก้ไขการสะท้อนหลงทาง
สังเกตสิ่งที่ขาดหายไป: “final key art” และ “production-ready typography” บางทีมสามารถไปถึงที่นั่นได้ด้วยการทำซ้ำและขัดเกลาโดยมนุษย์อย่างเพียงพอ ส่วนใหญ่ไม่ควรพยายามข้ามขั้นตอนเพียงเพราะว่าการส่งผ่านครั้งแรกดูเงางาม
วิธีที่จะเก่งในการสร้างภาพ AI จริงๆ
- เริ่มต้นง่ายๆ คำนาม กริยา บริบท รับฐานที่ดี
- ล็อค Seeds เมื่อคุณชอบทิศทาง จากนั้นทำซ้ำ: กล้อง เลนส์ แสง เวลาของวัน
- เก็บ stylebook ส่วนตัวขนาดเล็กไว้: 10 การอ้างอิงที่คุณชื่นชม พรอมต์ไปที่พวกเขาโดยไม่เอ่ยชื่อ
- ใช้ image-to-image เหมือนมืออาชีพ: ร่างคร่าวๆ บล็อกในองค์ประกอบ จากนั้นปล่อยให้โมเดลเพิ่มความสวยงาม
- เรียนรู้ที่จะครอบตัด องค์ประกอบคือครึ่งหนึ่งของการต่อสู้ และเครื่องมือครอบตัดยังคงอยู่ยงคงกระพัน
- Post-process Curves, grain, subtle bloom, actual type ห้าเปอร์เซ็นต์สุดท้ายมีความสำคัญ
คำถามเปิด: นี่คือ “ศิลปะ” หรือไม่
แน่นอนว่ามันเป็นได้ แน่นอนว่ามันก็มักจะไม่ใช่ เลนส์ที่มีประโยชน์คือความเป็นเจ้าของ หากคุณสามารถอธิบาย ทำซ้ำ และพัฒนาขั้นตอนของคุณได้ — หากมี throughline ให้กับตัวเลือกของคุณ — คุณกำลังทำความเป็นเจ้าของ หากคุณกำลัง slot machine-ing จนกว่าคุณจะได้สิ่งที่ยอดเยี่ยมและทำซ้ำไม่ได้ นั่นก็ใช้ได้สำหรับโปสเตอร์และ vibes แต่ไม่ต้องแสร้งทำเป็นว่ามันเป็นสิ่งเดียวกัน
ความเสแสร้งของอุตสาหกรรมที่ฉันไม่สามารถเพิกเฉยได้
มีสายพันธุ์หนึ่งของ AI boosterism ที่กล่าวว่าโดยพื้นฐานแล้วโมเดลคือศิลปินและคุณแค่โชคดีที่ได้อยู่ที่นั่น นี่มันถอยหลัง โมเดลคือกล้องที่มีเลนส์ 10,000 ตัวและอารมณ์ล้านอารมณ์ กล้องไม่ได้ถ่ายรูป คนทำ ต่างที่ดีกว่าคือเครื่องดนตรี วาง Steinway ไว้ในห้องนั่งเล่นของฉัน มันจะไม่แต่งเพลงโซนาตา อย่างไรก็ตาม มันจะทำให้นักเปียโนที่มีความสามารถฟังดูงดงามและคนที่ยอดเยี่ยมเป็นเลิศ พรอมต์ที่ไม่ดีฟังดูเหมือนการฝึกฝนที่ไม่ดี
ในทางกลับกัน สายบริสุทธิ์ที่ AI เป็น “การโกง” พลาดประวัติศาสตร์ที่ยาวนานกว่า การถ่ายภาพเป็นการโกง สีดิจิทัลเป็นการโกง Undo เป็นการโกง รหัสโกงที่แท้จริงคือการทำซ้ำด้วยความเร็วของความคิด หากคุณเต็มใจที่จะคิด
On Tools, Without the Hype
- Midjourney สำหรับ vibe และสไตล์ งดงามที่แสง cinematic ยังคงขุ่นมัวอย่างแปลกประหลาดในปุ่มและหน้าปัด ยอมรับอารมณ์ของมันแล้วมันจะให้รางวัลแก่คุณ
- DALL·E 3 สำหรับการทำตามคำแนะนำอย่างแท้จริงและสติสัมปชัญญะในการจัดองค์ประกอบ เหมาะอย่างยิ่งเมื่อลูกค้าเขียนพรอมต์เหมือนบันทึกการประชุม
- Stable Diffusion flavors (SDXL, SD3.x) สำหรับ control freaks และ tinkerers หากคุณสนุกกับ model versions, LoRAs และ local rigs นี่คือสนามเด็กเล่นของคุณ
- Firefly สำหรับทีมที่ใส่ใจเกี่ยวกับการชดเชยมากพอๆ กับที่พวกเขาใส่ใจเกี่ยวกับ bokeh
หากงานของคุณคือการสร้างภาพที่ผู้คนจะจ่ายให้ คำตอบที่ถูกต้องมักจะเป็น “ใช้มากกว่าหนึ่ง” สไตล์จากอันหนึ่ง การพิมพ์และการจัดวางที่อื่น ทำความสะอาดที่ใดก็ตามที่คุณเร็วที่สุด Tool monogamy เป็น vibe ไม่ใช่ขั้นตอนการทำงาน
Sider.AI เหมาะสมกับที่ใด (และที่ไม่เหมาะสม) เครื่องมือที่ช่วยให้คุณคิด ไม่ใช่แค่สร้าง underrated หากคุณกำลังเล่นปาหี่กับการวิจัย การอ้างอิง การทำซ้ำด้วยภาพ และพรอมต์ การมีผู้ช่วยที่จัดระเบียบสมองของคุณมีประโยชน์มากกว่าคุณสมบัติ “ดูสิ super-resolution อีกครั้ง” เครื่องกำเนิดเสียงดัง ขั้นตอนการทำงานเงียบ เงียบชนะบ่อยกว่า
แนวทางปฏิบัติที่ดีที่สุดที่ช่วยประหยัดเวลา
- สร้าง prompt library ไม่ใช่ 500 prompts; 15 prompts ที่ดีพร้อมบันทึกเมื่อพวกเขาทำงาน
- เก็บ seed bank ปฏิบัติต่อ Seeds เป็นพิกัด ติดป้ายกำกับแผนที่ของคุณ
- ตั้งชื่อ outputs ของคุณให้ชัดเจน Future-you คือผู้ทำงานร่วมกัน อย่าหยาบคาย
- ส่งออกฐานที่สะอาดเสมอก่อนที่คุณจะเริ่มแก้ไขอย่างหนัก คุณจะต้องย้อนรอย
- ทำซ้ำใน branches เมื่อแนวคิดแยกจากกัน ให้ทำซ้ำไฟล์และไปทั้งสองทาง
อนาคต: ปุ่มน้อยลง การตัดสินมากขึ้น
เมื่อโมเดลดีขึ้น โมเดลที่ดีที่สุดจะรู้สึกเรียบง่ายขึ้น — ไม่ใช่เพราะพวกเขาสูญเสียความสามารถ แต่เป็นเพราะพวกเขาเก่งขึ้นในการเคารพความตั้งใจ UI ที่ชนะไม่ใช่ห้องนักบินที่เต็มไปด้วยสลับ มันคือผืนผ้าใบที่เงียบสงบพร้อมตัวเลือกที่มีความหมายเพียงไม่กี่อย่างและค่าเริ่มต้นที่แข็งแกร่ง ที่เหลือคือรสนิยม และรสนิยมไม่ได้ปรับขนาด นั่นคือประเด็น
A Parting Quibble (หรือ Two)
หากคุณตื่นเต้นกับภาพ AI เพราะคุณคิดว่าพวกเขาจะลบผู้คนออกจากกระบวนการ เตรียมตัวให้พร้อมที่จะผิดหวังแล้วค่อยโล่งใจ เทคโนโลยีกำลังพัฒนาขึ้นเรื่อยๆ ผลลัพธ์ขึ้นอยู่กับผู้ที่รู้ว่าพวกเขากำลังทำอะไรมากขึ้นเรื่อยๆ นั่นไม่ใช่ความขัดแย้ง นั่นคือรูปแบบ
หากคุณคิดว่าเครื่องมือสร้างภาพ AI เป็นเพียงคลิปอาร์ตแฟนซี ให้จับตาดูต่อไป ช่องว่างระหว่าง “ของเล่น” และ “เครื่องมือ” ปิดอย่างเงียบๆ ในขณะที่ทุกคนโต้แย้งกันทางออนไลน์ โมเดลไม่ต้องการให้คุณบูชาพวกเขา พวกเขาแค่ต้องการให้คุณใช้พวกเขาด้วยความตั้งใจ ที่เหลือคือการฝึกฝน
และหุบเขา uncanny นั้น? มันกำลังหดตัว ช้าๆ อย่างน่ารำคาญ อย่างหลีกเลี่ยงไม่ได้ แต่ถึงแม้ว่ามันจะหายไป งานที่แท้จริงก็ยังคงเหมือนเดิม: ตัดสินใจว่าคุณต้องการจะพูดอะไร จากนั้นทำให้ทุกพิกเซลพูดมัน
FAQ
Q1: ตอนนี้เครื่องมือสร้างภาพ AI ทำอะไรได้ดีที่สุด
การสร้างแนวคิดและการทำซ้ำ เครื่องมือสร้างภาพ AI บดขยี้หน้าว่างเปล่า สำรวจสไตล์ และสร้าง comps ที่ใช้งานได้เร็ว — โดยเฉพาะอย่างยิ่งเมื่อคุณเก็บการพิมพ์และการขัดเงาขั้นสุดท้ายไว้ในมือมนุษย์
Q2: เครื่องมือสร้างภาพ AI ดีพอสำหรับงานเชิงพาณิชย์หรือไม่
ใช่ หากคุณใส่ใจเกี่ยวกับกระบวนการและใบอนุญาต ใช้เครื่องมือสร้างภาพ AI สำหรับการสำรวจและการเรนเดอร์ฐาน จากนั้นจบด้วยประเภทที่เหมาะสม การรีทัช และ toolchain ที่จะไม่ทำให้กฎหมายกระตุก
Q3: ฉันควรเลือกเครื่องมือสร้างภาพ AI ใดสำหรับผลลัพธ์ที่สมจริง
เลือกเครื่องมือที่ตรงกับรสนิยมของคุณ: Midjourney สำหรับอารมณ์ cinematic, DALL·E 3 สำหรับการทำตามคำแนะนำที่ซื่อสัตย์ และ Stable Diffusion variants หากคุณต้องการการควบคุมแบบละเอียด เครื่องมือสร้างภาพ AI ไม่สามารถใช้แทนกันได้ พวกเขามี priors ที่แตกต่างกัน
Q4: ทำไมข้อความยังคงดูแปลกๆ ในภาพที่สร้างโดย AI
เพราะการพิมพ์นั้นไม่ยอมใครง่ายๆ และโมเดลยังคงปฏิบัติต่อตัวอักษรเหมือนรูปร่างที่มีพื้นผิว เครื่องมือสร้างภาพ AI กำลังปรับปรุง แต่สำหรับ headlines และ brand type แบบอักษรจริงในเครื่องมือจัดวางจริงยังคงชนะ
Q5: ฉันจะเขียน prompts ที่ดีขึ้นสำหรับเครื่องมือสร้างภาพ AI ได้อย่างไร
เขียน brief ไม่ใช่คาถา ระบุรายละเอียดเกี่ยวกับหัวเรื่อง แสง องค์ประกอบ และข้อจำกัด ล็อค Seeds เมื่อทิศทางใช้งานได้ และทำซ้ำด้วยการเปลี่ยนแปลงเล็กน้อยและรอบคอบแทนที่จะกองคำคุณศัพท์