Disco Diffusion – 调教一只会画画的AI

发表于 2022-04-21  733 次阅读


文章目录

上网冲浪的时候看到了一个很有趣的AI生成画作工具,输入画面的描述词和调整相应的参数就能运行并生成一幅画作。在官方社区刷到了很多大佬的AI画作,很感兴趣,于是也想上手尝试一下。由于非常好上手(技术向的部分暂时学艺不精),分类到日常记录的部分。

需要的东西:连接互联网;Google账号;开启Google Drive空间

全程在Google的在线Colab上进行图形演算,使用的是Google端的云服务器,充值Pro版本可以获得更快的生成速度与每日可使用内存。
可以从 https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb 这个网站进入Disco DIffusion,也可以在浏览器搜索关键词进入最新版本。写下这篇博客的时候官方更新到了5.2版本。

1.调整参数

点进去的时候先登录Google账号与云盘授权,开始AI创作之旅——
一共有五个模块,可以展开看到具体的代码与参数。有很多的地方可以进行调整,在了解含义之前设置为默认一样可以照常运行。
先看一下GPU状态,免费版的生成一张图需要1h左右。结束会话后重新申请有几率申请到运算速度更快的,存在碰运气成分。

需要调整的主要部分3.Setting,在Basic Settings部分做些基础设置。Batch_name标注生成的图片名;steps是绘画的步长,与最终的细致度有关,数值越高越细腻,一般设置为250左右(500+后的画面区别不大);width_height是画面的尺寸。

4.Diffuse部分设置预览与生成张数功能,display_rate的数值是更新频率/帧,n_batches是AI在运行过程中需要生成的张数。

最重要的影响因素是Prompts部分,这条的描述用来给AI生成指令,获得最终的成品。0: [" "]部分填写语句,其余的框在动画模式下才需要填写。一般输入内容是想表现的场景或参考的艺术家风格等,这一步需要在英文输入法下进行。
举例:0: ["Cyber City in the air", "Neon lights", "Unreal Engine"]

设置完后拖到界面最上端,代码执行程序-全部运行,等待出图。运行完的图片会保存到云盘中,直接点击下载即可。偶尔有报错的情况,中断进程再点击全部运行。

2.生成画面

经过一些尝试,不同prompts语句会生成不同的画面,甚至相同的语句也会生成符合主题但完全不同的画面。
下面举几个博主尝试过的例子当作参考。

极光,雪原,星空,狐狸

初次尝试,凭感觉随意输入了几个英文单词,画面较抽象。

金发佩剑女孩,盛开的百合花,史诗感,动画画风

用文字描述了一下最近听的专辑封面,结果似乎…这个描述并不适合画人物。

蒸汽朋克,机械,复古的

看起来更具体的一张,和脑内构想的差不多,可以在不会画画的时候借助AI生成具体的画面。

有着许多画框的幽暗美术馆

尝试结果中好评的一张,试图表现阴森气氛,AI在场景方向的生成比较符合预期。想起了最近的重置版Ib(?

提示词总结:

描述词尽量使用视觉上较好辨认的物件,便于AI确认绘画主体。
在描述词中加入风格,生成的画作会更偏向指定风格。
人形的描述暂时还找不到合适的生成词,生成结果有些难以分辨。
没有具体构图指向的物体自由度较高,生成结果可能会很惊喜,也可能很克(不。

从生成的结果来看,描述画面的能力也是十分重要的。这需要对提示词作出精准的描述,经过多次尝试才能得出较为合适的描述方法。AI作画逐渐流行,似乎并不代表可以取代美术行业,而是可以减少部分思考构图的人力,使用得当可以有效提高生产力。

初次尝试,对其中的一些参数进行了微调,其它可调参数还在探索中,在这里做一个记录。暂时没有充值Pro的打算,每天薅免费内存找脑洞生成着玩儿。

ฅ(Slack有话要喵)ฅ

有了AI画画机,本喵也会画画了!
先来试试如何编写描述词吧喵~

本站文章基于国际协议BY-NA-SA 4.0协议共享;
如未特殊说明,本站文章皆为原创文章,请规范转载。