Midjourney 应用场景5:头像

在 Stock Photo 一章中,介绍了 img2img 的方法,这个方法除了解决 Stock Photo 的那几个问题外,还很适合多个场景。

本章会着重介绍用这个方法生成的头像的 prompt。并且从本章开始会逐步丰富我们的 prompt 结构,使其更加完整。

注意事项

在介绍 img2img 的应用前,我想强调一下:

  1. 不要在 Discord Midjourney 公开群上传自己的照片!这样你的照片会被公开群里的所有人看见。建议使用 Midjourney Bot。
  2. 另外,非 pro 付费会员,生成的图片都会被其他会员看见。但你可以在生成完头像后,删掉生成的图片。如果还不知道如何使用 Bot ,及删除照片,请看基本操作篇。
  3. img2img 的操作我就不过多赘述了。如果你还不太清楚,可以看基本操作篇,以及 Stock Photo 那篇。

3D 卡通头像

第一个要分享的是卡通头像。首先跟大家强调下:

  1. 我基本上把国内国外的生成头像教程都看过,并试过一遍,还跟 Midjourney 社群的人也交流过。我的理解是,以目前 V5 的能力,不管你如何调整 prompt ,想用 img2img 方法生成一张非常像原图的图片,基本靠运气,即使用了前面介绍的技巧七方法,也只是提高概率。如果你有令头像非常像的方法,不妨通过 Issue 分享给我,我会署下你的名字,并分享给大家。
  2. 各位在学习的过程中,如果发现生成的图片不像原图,也不需要气馁。这是正常的。
  3. 你可以通过我分享的方法,生成一张有原图神韵的卡通头像。注意肯定不会非常像原图。

在 prompt 里加上原图链接(建议使用证件照,或者背景比较单一的照片,这样成功率会高一些),然后用我前面提到的框架设计一个 prompt:

Prompt解释
类型是什么?Portraits / Avatar如果你的原图是证件照,可以在 prompt 里加入「肖像」一词,或者「Avatar 头像」。
主体是什么?smiling cute boy, undercut hairstyle这里可以是选填,你可以先不加这个描述,只填其余 prompt,然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词,一般就是性别、样貌、发型、配饰(比如眼镜、耳环等)、表情等。注意,尽量挑特征比较强的部分输入,特征对了,生成的图片基本会有几份像。
背景是什么?white background我这里保留了证件照的白底,你可以加一些实际场景的背景,比如餐厅之类的。
构图是怎样的?null因为我们预先传了图片,图片是张证件照,所以不填
用什么镜头?soft focus柔焦是指摄影中,使用柔焦镜头,使得拍摄的影像既清晰又柔和的效果。一般多在拍摄人像的时候使用,我在 prompt 里加上这个,可以使照片更柔和。你也可以不加。
是什么风格?3d render,Pixar style因为目标是生成 3d 照片,所以这里加了 3d render(3d 渲染),以及我喜欢的皮克斯风格
参数—iw 2iw 是一个文字和 img 权重参数。数值越大,就越像原图,关于这个值的介绍,可以看高级参数篇。

最后,还有三个技巧:

  1. 如果你生成的照片并不像预设的照片,可以在四张图里,挑一张比较像的,然后点 V(Variation),让模型继续生成,再继续挑一张像一点的照片,然后继续生成新照片,直到出现一张比较像的。
  2. 第二个,我觉得很神奇,如果前两个方法你都试过了,你生成的图片还是跟原图不像,那就在 prompt 里加上「wear glasses(戴眼镜)」,真的很神奇,我只要加上戴眼镜就像非常多,如果你原图戴眼镜了,你试试在参数里加个 —no glasses,你会得到一张更不像你的图。
  3. 最后,就是多用一个参数,这个方法会在技巧八中展开说下。

本章最后,有我的证件照的案例。

技巧七:多参数同时使用

在使用 img2img 的方法生成头像时,我发现问题是「文字权重比图片权重高」,导致其生成的图片不像原图,iw 参数在 V5 里最多提升图片权重到 2,所以我就在想有没有可能进一步降低文字的权重。

然后我就试了下 s 参数,发现的确好了很多。

如果生成的图片还是不像,你可以在 —iw 2 基础上,再加一个参数 —s 200 ,注意同时用两个参数时,中间不要有逗号。我发现加了 s 参数之后的确像了很多,我个人猜测是 s 和 iw 连用会进步一削弱 text 的权重。

s 是控制生成图片的风格化程度。简单理解,这个值越低会更符合 text prompt 的描述,数值越高艺术性就会越强,但跟 text prompt 关联性就会比较弱。所以如果你生成的图还是不像,就加大这个值,比如调到 500。

我想通过这个案例告诉大家,多个参数一起使用,有可能会形成合力,进一步放大模型的能力。未来有新的参数能力,不妨也想想有没有可能一起用?

动漫风头像

与 3D 卡通头像一样,主要的修改是在图片风格上:

Prompt解释
类型是什么?Portraits / Avatar继续使用相同描述
主体是什么?smiling cute boy, undercut hairstyle继续使用相同描述
背景是什么?white background继续使用相同描述
构图是怎样的?null继续使用相同描述
用什么镜头?null因为是漫画风,就不加柔光镜头了
是什么风格?anime, Studio Ghibli目标是制作动漫风的头像,所以这里加了 anime(动漫),然后加了吉卜力风格
参数—iw 2 —s 500注意同时用两个参数时,中间不要有逗号。

赛博朋克头像

这是我最喜欢的风格之一,也是只需要改一下风格和背景即可:

Prompt解释
主体是什么?cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing加了脸的修饰,还有戴上 VR 眼镜,穿上赛博朋克风衣服
背景是什么?neon-lit cityscape background为了让图片更像是赛博朋克,就加了个霓虹灯城市背景,让其看起来更有赛博那味
是什么风格?Cyberpunk, by Josan Gonzalez加了赛博朋克风格,以及我非常喜欢的赛博朋克画家 Josan Gonzalez

技巧八:使用 Seed 参数对图进行二次修改

注意:这个技巧,我个人觉得未来潜力比较大,但目前 Midjourney 的实现效果还比较一般,效果得不到保证。官方的社区的帮助文档也提到这个功能在 V5 非常不稳定。详细可以看看我整理的 Midjourney 官方 FAQ 一章。

你可能遇到类似这样的场景:

  1. 你输入一段 prompt,机器生成了 4 张图片
  2. 你看了下4张照片,发现其中有一张还行,但其余不是很满意,然后改了下 prompt,机器又生成了一些
  3. 但这次生成的照片你都不满意,你就很烦恼为何会这样
  4. 然后你就像为啥不能在第一次生成图上做修改呢?

基于某一次生成的结果进行二次 prompt 修改,理论上我认为是可以的,以赛博朋克头像为例,我先用上述 prompt 生成了四张图片,然后在消息的右上角点击 emoji 按钮(下图1),然后再输入框里(下图2)输入 envelope,然后点击信封 emoji(下图3),接着 bot 就会将 seed 号码发给你。

然后我修改上面的赛博朋克头像的 prompt,将其背景改为 China Town,此时需要注意:

  1. 新的 prompt 并不是只改 background,你需要将之前的 prompt 都带上。
  2. prompt 仅修改 background 的部分。
  3. 最后带上 seed 参数。

以下是我的案例:

原 prompt:

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez –s 500 –iw 1

新 prompt(seed 码只是示例,你要填写自己的 seed):

 {img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez –s 500 –iw 1 –seed 758242567

以下是生成的效果(左图为原图,右图是用了 seed 后生成的图),可以看到,背景的确换了,但人的外观也有点变化

效果不是很好,但我觉得值得探索,这样能提高渐进优化的成功率:

技巧九:神秘的 blend 功能

这个技巧,说实话,我感觉不能称其为技巧,但这又是一个 Midjourney 非常重要的 feature,所以在这里着重介绍一下。

这个功能使用起来非常简单,在 Discord 输入框里 /blend,然后点击这个菜单:

之后你的输入框就会变成这样:

然后你就可以点击这两个框,然后选择你电脑上的照片,添加完成后,点击回车:

然后 Midjourney 就会生成这样牛逼的结果,左边是融合钢铁侠,右边是融合巴斯光年:

这个功能我第一次看到时,我是非常震惊的,以为是小时候看游戏王里主角们使用「融合卡」的那种效果。可惜并不是,这个功能非常不稳定,仅有在满足多个未知条件才能达到上述的效果。

我本来打算用这个方法用于生成头像,但我发现只要用自己的照片,融合其他风格的照片,效果都不太好,目前实验下来效果最好的是名人头像,我的感觉是因为 Midjourney 喂了不少名人的头像给模型,所以这种融合的效果都很好。

但我觉得它真的很适合做头像,将自己的头像跟另一张图片融合一下,就能生成一张不错的图,方便又快捷。可惜目前这个功能感觉还不太好用。

当然这个功能还不仅仅止于此,它还有很多使用场景,在后续会介绍给大家。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/280491.html<

(0)
运维的头像运维
上一篇2025-05-12 13:26
下一篇 2025-05-12 13:28

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注