掌握提示词写作是解锁AI图像生成潜力的核心技能,遵循结构化方法能显著提升生成结果的质量和可控性。
核心思想:AI提示词是你与AI模型沟通的桥梁。目标是清晰、精准、详细地描述你脑海中的画面,引导模型理解并生成符合预期的图像。
一、 核心原则:C.R.E.A.T.E. 方法论
-
C – Clear (清晰):
- 目标明确: 你希望生成什么?人物、风景、概念艺术、产品设计?
- 避免歧义: 使用精准词汇。例如,“动物”不如“毛发蓬松的橘色虎斑猫”清晰。
- 简洁高效: 避免不必要的词汇干扰模型理解核心意图。
-
R – Relevant (相关):
- 聚焦主题: 所有元素都应服务于核心概念。避免添加无关细节分散模型注意力。
- 背景关联: 确保场景、角色、物体、风格在逻辑或美学上相关联。
-
E – Elaborate (详尽):
- 细节为王: 这是提升质量的关键。描述:
- 主体: (是什么?) 人物(外貌、发型、表情、服饰、姿态)、物体(形状、材质、颜色、纹理)、动物(种类、特征)。
- 场景: (在哪?) 室内(房间类型、陈设、灯光)、室外(自然环境、城市景观、天气、时间)。
- 风格: (看起来怎么样?) 艺术风格(油画、水彩、赛博朋克、极简主义、浮世绘)、摄影风格(长焦、广角、微距、胶片颗粒)、渲染风格(3D渲染、黏土动画、低多边形)。
- 构图: (如何布局?) 镜头视角(鸟瞰、仰视、特写、全景)、构图方式(中心构图、三分法、对称)。
- 氛围/光照: (感觉怎么样?) 情绪(欢快、忧郁、神秘、史诗感)、光线(自然光、霓虹灯、烛光、戏剧性光影、黄金时刻)。
- 色彩: (什么颜色?) 调色板(柔和、高饱和、单色、互补色)、特定颜色强调。
- 使用修饰词: 形容词和副词是描绘细节的利器(闪耀的、破旧的、优雅的、动态的、朦胧的)。
- 细节为王: 这是提升质量的关键。描述:
-
A – Apply Weighting (应用权重):
- 强调重点: 使用
(关键词:权重值)(如(cinematic lighting:1.5))或[关键词](某些平台)来增加或减少某个元素的“重要性”。 - 控制强度: 权重
1.2-1.5表示轻微强调,2.0或更高表示强烈强调。权重<1(如0.8) 表示减弱。 - 平衡元素: 防止某个次要元素喧宾夺主,或确保关键元素不被忽略。
- 强调重点: 使用
-
T – Test & Tweak (测试与调整):
- 迭代是关键: 很少有提示词一次成功。准备好进行多轮生成和修改。
- 小步快跑: 每次调整少量变量(改一个关键词、加一个修饰词、调整权重),观察效果。
- 分析结果: 生成的图像哪里不符合预期?是细节缺失、风格不对、构图不佳,还是出现了不想要的元素?根据问题反推提示词需要如何修改。
- 利用负向提示: 明确告诉模型不要什么(如
ugly, deformed, blurry, text, extra fingers)。这对排除常见错误非常有效。
-
E – Explore & Experiment (探索与实验):
- 学习他人: 研究优秀的提示词案例(社区、平台分享),理解其结构。
- 混合概念: 尝试意想不到的组合(“蒸汽朋克宇宙飞船在威尼斯水道上飞行”、“水墨风格的机械恐龙”)。
- 尝试风格融合: 结合不同艺术家或艺术流派的风格。
- 利用模型特性: 不同模型(如 Midjourney, Stable Diffusion, DALL-E)有各自的“偏好”和语法细微差别,需要针对性学习和尝试。
- 参数调整: 了解并尝试调整生成参数(如采样器、步数、CFG Scale/引导强度、种子值)。
二、 提示词结构(进阶组织)
一个强有力且组织良好的提示词通常包含以下部分(顺序可调整):
- 核心主体: 描述画面中最核心的物体或人物。
(必需) - 详细描述: 为主体添加丰富的细节(外观、材质、动作、表情等)。
(必需) - 场景与环境: 主体所处的背景、地点、周围元素、天气/时间。
(推荐) - 艺术/摄影风格: 明确想要的视觉呈现方式。
(强烈推荐) - 构图与视角: 画面的布局和观看角度。
(推荐) - 光照与氛围: 光线效果和整体情绪。
(推荐) - 色彩方案: 整体或特定的色彩倾向。
(可选) - 技术参数/质量提升词: 如
high resolution,intricate details,8k,photorealistic,Unreal Engine 5(即使不是真的UE5渲染,也能引导风格)(常用) - 负向提示: 明确排除不想要的内容。
(常用且有效)
示例结构: [艺术风格], [核心主体] + [详细描述], [场景/环境], [构图/视角], [光照/氛围], [色彩], [质量提升词] --neg [负向提示]
实例:
Epic fantasy illustration, a majestic silver dragon with iridescent scales and glowing blue eyes, perched atop a snow-capped mountain peak at sunset, dramatic backlighting, volumetric clouds, cinematic lighting, vibrant colors of orange and purple, highly detailed, digital art, trending on ArtStation, 8k --neg blurry, deformed, text, signature
三、 实用技巧与注意事项
- 善用分隔符: 逗
,是最常用的分隔符。有时使用双冒号::(尤其在Stable Diffusion中)可以更清晰地分隔概念。避免使用可能被模型误解析的特殊符号。 - 关键词顺序: 通常,越靠前的词汇权重越高。把最重要的元素(主体、风格)放在前面。
- 学习模型词汇表: 了解特定模型识别的“魔法词”(如 Midjourney 的
--v 5.2,--style raw,--ar 16:9; SD 的某些 LoRA/Embedding 触发词)。 - 概念具体化: “美丽”是主观的,用更具体的描述代替(如 “symmetrical face, flawless skin, captivating green eyes”)。
- 避免冲突指令: 不要同时要求矛盾的效果(如 “photorealistic cartoon” 可能效果不佳,但 “stylized photorealistic” 可能可行)。
- 利用种子值: 如果生成了一张接近满意的图,使用相同的
Seed值并微调提示词,可以在保持主体/构图大致不变的情况下进行优化。 - 分阶段生成: 对于复杂场景,可以先生成主体,再用图绘/局部重绘功能完善背景或细节。
- 参考图: 许多平台支持上传参考图进行图生图或风格参考,这是非常强大的辅助手段。
- 了解局限性: AI 在生成精确文本、复杂手部、特定数量物体、极度写实的人脸等方面仍有挑战。负向提示和迭代调整是应对方法。
- 伦理与版权: 尊重艺术家风格,避免直接模仿在世艺术家或生成侵权内容。了解平台政策。
四、 工作流程总结
- 定义目标: 明确你想生成什么。
- 头脑风暴关键词: 围绕目标列出所有相关的核心词、细节词、风格词等。
- 构建初稿: 按照结构组织关键词,形成清晰、详尽的提示词。
- 应用权重/语法: 对关键元素进行强调。
- 添加负向提示: 排除常见错误或不想要的元素。
- 首次生成: 运行提示词,观察结果。
- 分析与诊断: 结果哪里好?哪里不好?问题出在提示词的哪个部分?
- 迭代优化: 精准调整提示词(增删改关键词、调整权重/顺序、修改负向提示)。
- 参数微调: 尝试调整生成参数(CFG Scale, 步数等)。
- 重复 7-9: 直到获得满意结果。
- 保存与学习: 保存成功的提示词和参数,分析其有效的原因,积累经验。
记住:AI提示词工程是一门艺术,也是科学。 耐心、细致观察和持续练习是提升的关键。没有绝对的“完美”提示词,只有最适合当前目标和模型的提示词。享受探索和创造的过程!