Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Main page
Recent changes
Random page
freem
Search
Search
Appearance
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
如何用AI画图
(section)
Add languages
Page
Discussion
English
Read
Edit
Edit source
View history
Tools
Tools
move to sidebar
hide
Actions
Read
Edit
Edit source
View history
General
What links here
Related changes
Special pages
Page information
Appearance
move to sidebar
hide
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
== 优化AI生成图像的方法 == AI生成图像往往需要经过多次试验和调整才能达到理想效果。以下提供一些优化生成结果的技巧,包括'''提示词工程'''和'''图像后处理'''两方面: * '''精心设计提示词(Prompt Engineering):提示词(prompt)的描述质量直接决定了生成图像的效果。首先,要明确且具体'''地描述所需内容,包括场景元素、风格、色彩和细节等。过于笼统的描述会使AI难以捉摸重点;加入细节能够引导模型关注特定特征 (The Best AI Image Generators: DALL-E vs Midjourney vs Others) (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。例如,与其说“一个城市街道”,不如说“黄昏时分雨后霓虹灯闪烁的城市街道,路面反射灯光”。DALL·E这类模型允许非常长的提示(最多1000字符) (The Best AI Image Generators: DALL-E vs Midjourney vs Others),可以容纳复杂细节;但Midjourney等有时'''简明的短语'''反而效果更佳,因为它会自主发挥 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。可以根据工具特点调整描述长度。其次,学会使用'''风格关键词'''。很多模型对特定风格、流派、艺术家名都有“触发词”,在提示中加入如“巴洛克风格”或“赛博朋克”可显著改变画面风格。但是涉及当代在世艺术家时需谨慎或遵守平台政策(某些平台禁用直接提及在世艺术家名字以防版权争议 (The Best AI Image Generators: DALL-E vs Midjourney vs Others))。再次,利用'''分段描述'''提升清晰度。可以将主要场景和修饰细节用逗号或句子隔开,这样模型更容易逐块理解。如:“一位身穿红色长裙的女子站在古老图书馆中央,四周堆满书籍,阳光透过彩色玻璃窗洒下 – 油画风,柔和暖色调,细节精致”。最后,保持'''迭代尝试'''的心态,多次尝试不同措辞并比较输出,从中总结出最佳用词。 * '''使用负面提示词排除干扰:许多生成模型支持所谓负面提示(Negative Prompt)''',用于明确告诉AI哪些内容是“不希望出现”的 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。例如在Stable Diffusion的Web界面或一些第三方应用中,可以输入负面提示词“ugly, low quality, extra limbs”(丑陋、低质量、多余肢体等),来减少常见的失真问题 (Fixing Deformed AI Generations: Improve AI Image Quality)。Midjourney则通过在提示后加<code>--no 某元素</code>实现类似效果 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。善用负面提示能有效'''抑制常见缺陷''',如让模型避开不需要的背景物体、避免出现多手指等人体畸形 (Fixing Deformed AI Generations: Improve AI Image Quality)。需要注意负面提示也要简明扼要,过长可能适得其反。一般来说,把最干扰观感的问题列出来即可,比如“--no text, --no watermark”来避免文字水印。负面提示词在精修人像、排除风格不符元素方面特别有用,是高级提示词工程的重要一环。 * '''参考图像与混合提示:巧妙利用图像提示(Image Prompt)能提升输出的可控性。Midjourney和Stable Diffusion都支持将一张参考图片与文字一起作为提示,让模型参考图像的构图或风格再生成新图 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。例如,可以提供一张草图,搭配文字描述颜色材质,让模型按照草图轮廓生成细节丰满的成品图(需要借助Stable Diffusion的img2img或ControlNet功能)。又或者提供一张风格类似的范例图片,让AI在此基础上变换出新的内容。这样的方法在需要特定构图'''或'''模仿某种美术风格'''时非常奏效。不过在使用他人作品作为参考时要注意版权。通过图像引导,AI输出会更贴近预期,也减少了完全凭文字生成的不确定性。 * '''调整生成参数:大多数AI绘图工具都提供一些参数调节选项来影响结果。常见参数包括图像尺寸或长宽比'''(aspect ratio)、'''随机种子'''、'''采样步数'''、'''模型版本'''等。合理设置这些参数可以优化输出。如在Midjourney中使用<code>--ar 16:9</code>产生宽屏比例的图,以满足横幅或壁纸的需求 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。Stable Diffusion可以设定采样步数和CFG Scale(引导系数)——步数过低图像可能模糊,太高则耗时且变化不大;CFG过低画面可能偏离提示,过高又可能导致构图死板。找到平衡值很关键。另一个技巧是'''固定随机种子''':如果想要复现或细微调整之前得到的某张图,可以记录下生成所用的随机种子,这样更改部分提示或参数时还能保留原先的一些构图元素,实现'''可控迭代'''。总之,充分利用工具提供的参数滑杆,能在探索创意和满足需求之间取得更好平衡。 * '''图像后处理:拿到AI生成的图像后,往往还可以通过后期处理进一步提升质量或修饰细节'''。一方面,可以使用'''AI图像放大'''工具提高分辨率和清晰度。由于模型生成时考虑计算成本,输出尺寸通常有限(如512x512或1024x1024像素),直接放大会模糊。使用训练过的超分辨率模型(例如ESRGAN系列)可以在放大的同时填充细节 (How to use AI image upscaler to improve details - Stable Diffusion Art)。许多Stable Diffusion本地GUI内置了诸如Real-ESRGAN 4x的放大选项,一键放大并增强纹理,使图片适合打印或高清展示 (How to use AI image upscaler to improve details - Stable Diffusion Art)。Midjourney提供的Upscale按钮也是利用内部算法将图片尺寸翻倍并锐化 (The Best AI Image Generators: DALL-E vs Midjourney vs Others)。另一方面,可以进行'''局部润色和修补'''。如果图像某部分不理想(如人物手部怪异或者背景瑕疵),可以借助'''局部重绘(Inpainting)技术:在Stable Diffusion的工具中遮罩选定区域并输入修正描述,让AI只重新生成局部内容,其他部分保持不变。这对于修复面部细节、替换背景元素非常有用。同样,如果使用Photoshop等传统软件,也可手工或借助其生成式填充(Adobe Photoshop的“生成填充”功能基于Firefly)来编辑AI图像。很多从业者的工作流程是AI生成 + 人工后期''':先快速用AI出基础图,然后在Photoshop中结合分层调整、笔刷细画,得到专业且符合要求的最终作品。这种人机结合能够弥补AI在精细度和特定创意上的不足 (AI-Generated Art Still Needs a Human Touch | Worth)。另外,后期处理还包括基本的调色、对比度锐化等,使图像风格更加统一。 * '''多样性与筛选:即使有了好的提示词,也建议每次生成多张'''图像,从中挑选最符合预期的,并进一步优化。AI模型本质上有随机性,不同次生成可能有意外惊喜。利用这一点,可以'''批量探索''':调整一两个词或更换种子,多出一些候选图。然后综合各张优点,如果有必要甚至可以通过拼接合成的方式取长补短(例如一张图人物姿势好但表情欠佳,另一张表情好但构图略差,可以在后期将满意的脸部P到好的构图上)。这种人工挑选与编辑的过程,可以极大提升最终作品质量。正如有评论指出的:“DALL-E 2、Midjourney、Stable Diffusion能一键生成令人印象深刻的图像,但'''要将它们打磨完美仍需要耐心和技巧'''” (AI-Generated Art Still Needs a Human Touch | Worth)。因此,将AI视为快速出草稿和多样化创意的工具,人脑仍负责把关和润色,才能发挥最大效果。
Summary:
Please note that all contributions to freem are considered to be released under the Creative Commons Attribution-ShareAlike 4.0 (see
Freem:Copyrights
for details). If you do not want your writing to be edited mercilessly and redistributed at will, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource.
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)