当前位置:首页 > 电脑快讯 > 正文

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

当我们第一次写这个故事的时候,OpenAI的Dall-E 2是生成性人工智能艺术中的主要名称之一,还有其他一些名称,如中途和稳定扩散。自那个很久以前的时代(称为2022年)以来,Dall-E已经走过了很长一段路。我们现在是第三代(Dall-E3),由于即时的提示定制,它有了显著的改进,特别是在理解文本提示和更精确的(理论上)。

这位图像创建者现在还完全集成了ChatGPT Plus,这是OpenAI的文本AI生成器的付费版本,每月20美元。Dall-E 3同样是ChatGPT团队和专注于企业的ChatGPT Enterprise的一部分。

Dall-E 2的使用现在只为传统用户提供了一个选项。他们现在仍然可以购买学分(115个学分15美元)来输入提示。但为什么要在Dall-E3等待的时候费心呢?

Dall-E(以及所有生产性人工智能)的使用伴随着几个伦理问题,因为大多数人的能力都是建立在勤奋的艺术家的背上的,他们从未允许他们的作品用于培训。现在Dall-E内置的一个解决方案是,它不会总是模仿特定的所需样式,特别是在存在版权问题的情况下。此外,根据该网站的说法,艺术家们可以要求退出他们的图像,不再培训“未来的图像一代模型”。

Dall-E3内置到了其他工具中。例如,Shutterstock艺术服务的用户可以使用它来生成新的图像,并知道他们在道德上更加谨慎了。(毕竟,Shutterstock艺术在一定程度上是用来训练Dall-E人工智能的。)微软对OpenAI的大笔投资使ChatGPT 4/Dall-E 3成为Windows和Office内置的各种Copilot选项的首选生成器。(副驾驶的实施也存在道德问题。)

你到底是如何与Dall-E合作的?它真的像输入一个描述–称为提示符–然后得到一张照片那么简单吗?老实说,是的。但如果你想得到一个接近完美的结果,还有更多的事情需要注意。

注册并付清费用

从标准的ChatGPT在chat.Openai.com上的帐户开始。如果你没有,使用苹果、谷歌或微软的帐户,或者使用电子邮件地址和更强的密码创建登录帐户。在此阶段没有多因素身份验证选项。

一旦你进入,你会看到左下角的升级计划,或者顶部的菜单显示ChatGPT 3.5,它提供了切换到GPT-4/Upgrade to Plus的选择。任何一个都将显示此屏幕,并带有升级到Plus选项。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

升级的实际费用是20美元加税;按8%的价格计算,每月21.60美元。上面清楚地写着:“您将按照上面所列的金额和频率收取费用,直到您取消为止。”没有试验的选择。支付并登录后,桌面界面看起来是一样的,但一定要从顶部的菜单中选择ChatGPT 4。如果你在底部点击你的名字并检查设置,你现在就可以打开多因素身份验证之类的东西。

顶部的菜单还会告诉你,在GPT-4和Dall-E 3下,你会在三个小时内收到40条消息。这比它在发布时提供的三小时内50条信息有所下降。这一减少很可能是为了在服务使用量增加的情况下控制流量。

为聊天做好准备

与之前的Dall-E 2不同,Dall-E 2有自己的界面,Dall-E 3只是ChatGPT 4的另一个方面,在ChatGPT 4中,您发送一条“消息”,聊天机器人做出响应。值得庆幸的是,使用GPT-4,您可以进行持续的对话,以改变/适应/改进它为您生成的内容。这包括图片。在高级ChatGPT Plus上,提示符限为4000个字符-约500个单词。

请注意,Dall-E 3也适用于手机版的ChatGPT应用程序(适用于iOS和Android)。只需使用相同的ChatGPT Plus帐户登录即可。在手机界面上,你可以选择使用手机摄像头拍摄的照片、上传已有的图片或上传文件。还有一个耳机图标,可以激活使用你的语音输入的选项。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

既然我们谈论的是创建图像,那么您的提示符应该以“创建图像”开始。

Dall-E 3可以使用您自己的图像作为新的AI生成内容的基础。要上传图片,请使用回形针附件图标。

要用具有生成性的人工智能创作艺术,提示是关键。这是大多数人都会跌倒的地方。一个最初的提示被抛给了一种生成性的艺术人工智能,它往往会让一些东西变得……有趣。它很少是完美的。事情总是有一点糊涂。有点奇怪。有点不对劲。一旦你完善了提示符,图像就会变得更好。

完美的提示

设计提示应该既有主题术语的内容(你想看到的),也有风格修饰符(应该是什么样子)。例如:“机器人在画架上画画”是内容,但“越过肩膀,五颜六色,油画,以梵高的风格”都是修饰语。您也可以使用其他几个修饰符来提高质量,将Dall-E集中在特定的事情上,或者只是添加一些额外的创造力。使用情绪化的词语来获得更积极或更消极的形象,并设定情绪或审美。虽然你可以要求某些风格的东西,但当ChatGPT试图遵循版权规则时,一些请求将会出错(见下文)。

你的细节越具体,你使用的艺术或摄影术语越恰当,效果就越好。例如,表示相机的拍摄信息,如相机型号、焦距等,以获得更好的人造照片。

您会注意到,当生成图像时,ChatGPT Plus对提示符进行了一些迭代更改,以改进输出。如果你觉得你的措辞足够得到你想要的,在提示中提到“不要添加细节”或“不要修改/改变提示”。如果你发现自己在每次新的提示时都会这样做,点击右下角的你的名字,然后选择Customize GPT来设置一个修饰符,强制聊天机器人使用你的提示而不做任何更改。

不觉得很有创意吗?雇佣人员来创建正确的提示,以获得正确的艺术。但是,如果您要经常这样做,那么自己直接获得提示符将是一件好事。

最大的帮手可能是ChatGPT本身。你可以让它用几个基本的词(比如“令人惊叹的巨型机器人”)给你写一个Dall-E的提示符。它会吐出一大堆你可能没有考虑过的细节。一些人称其为“提示”。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

然后由您决定是否使用更多消息来优化提示符。做一些事情,比如要求在以下方面做出改变:

Dall-E 3的新提示符创建了一个新图像;它不会对现有图像进行简单的调整。有时它会完全抛弃你的原创作品。确保询问您喜欢的任何图像的层代ID(见下文)。

单击图像下方的重新生成图标(看起来像一个向左旋转的“撤消”箭头)以生成新版本。它将保留旧版本。你想再生多少就再生多少,但每次点击都可能会消耗你每小时ChatGPT的消息配额,而且这个按钮在一段时间后似乎就会消失。

如果你真的不喜欢一张图片,点击向下的拇指表示结果是“糟糕的反应”。这引发了ChatGPT的一些问题。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

Dall-E3有两种风格选项。对于它特别擅长的超现实感来说,默认是生动的。尝试在提示符中输入“style:Natural”以获得更逼真的图像。这是值得尝试的,尽管观察者可能会看到生动与自然的对比。同样,有两个质量选项:标准(默认)或高清以获得更多细节。指定要在提示中显示的内容。

更改大小和保留样式

使用Dall-E3,默认情况下每个提示符只有一张图片。但是,您可以指定它从一个提示生成最多10个。(使用Dall-E2时,您总是有四种不同的选择。微软的Copilot也是如此;同样,它是由Dall-E3驱动的。)或者,你可以在聊天中输入多个独特的提示,以接收多个图像,每一张图像都是其提示的专用图像,而不是同一措辞的所有变体。

默认情况下,来自Dall-E的图像以1024×1024像素的正方形显示。但是,您可以通过在提示中使用这些数字或指定为“纵向”或“横向”,将其指定为更高(1792×1024)或更宽(1024×1792)。

如果您想要同一张图像的更大比例的版本,该怎么办?有第三方工具可以做到这一点(见下文),但Dall-E3也可以放大图片。只需简单地说“使用代码解释器将此图像升级2倍”。最后三个字是关键–它们迫使Dall-E3只是增强现有的形象,而不是重塑它。你将不会在聊天中再次看到放大的图片;相反,你会收到一个下载链接。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

如果您想在以后使用不同的内容复制图像的样式,请向ChatGPT索要最新图像的“gen_id”(Generation ID的缩写)。Dall-E制作的每一张照片都会得到一张。它会给出一长串要复制的数字,如“yRmG5bW4bmcfWbVP”。您也可以使用层代ID返回并让Dall-E3在图像上重新生成变体,即使在重新生成图标消失后也是如此。

稍后,输入提示并附加“in the style of Image_”字样。或者说:“给我一个形象_,但要换件正式的衣服。”你想要什么都行。输入空格的数字字符串。他说:

保存您喜欢的任何图像的Gen ID对于该图像的未来迭代非常重要。这里有一个使用Gen ID的很好的指南。

你能生成一个一致的角色/角色,在不同的Dall-E 3图像中重复使用吗,就像你在中途可以做的那样?差不多了。如果您请求图像的“种子”,您将得到一个小数字字符串,然后您可以使用它来尝试并重新创建与前一个图像具有一定一致性的图像。(您也可以在初始提示符中为图像指定种子编号,只需选择几位数字。)接下来,尝试诸如“修改带有种子#的图像,但更改背景”之类的提示。

种子编号也是一种重建图像的方法,如果您有之前使用的完全相同的提示符。您也可以为自己创建一个GPT,以帮助维护一些图像到图像的规律性。但一致性不太可能达到100%。只是现在多产的人工智能目前是如何工作的。

如果您访问“如何希望ChatGPT响应”下的“Customize ChatGPT”,请输入“当输出DALL-E 3图像时,始终显示GEN_ID和种子”。将来,您将每次都会看到此元数据。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

不要忘记,ChatGPT Plus还支持GPT,这是一种使用特定参数运行的定制聊天机器人。*您可以在左侧导航的探索GPTS下找到它们。其中有12个特色是特定于Dall-E3图像生成,但在搜索中还有更多。你也可以自己做。

Dall-E3做不到的事

OpenAI的政策是不描述仇恨符号、暴力、欺骗性主题或直接显示任何明显受版权保护的东西。它也不会产生真人的图像。好吧,反正也不应该是这样的。

过去,你可以参考电影和电视剧来接近它们的外观和风格,但当我让Dall-E制作一个星球大战风格的机器人时,ChatGPT斥责我,说“制作一个‘星球大战’风格的形象受到我们内容政策的限制,这阻止了我生成直接受到版权材料启发的图像。”我去掉了那个角色,得到了一个笨重的、有艺术气息的机器人。您可以看到2022年Dall-E 2与2024 Dall-E 3之间的差异。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

后来,我要求它渲染我上传的一张以《辛普森一家》风格上传的图片。它遵守规定没有任何问题。

在Dall-E 2中,用户可以选择画外画-这一功能将获取初始的正方形图像,并允许用户扩展边框,这将填充更多人工智能生成的艺术。它类似于Photoshop中的生成性填充功能。

不幸的是,你目前还不能在ChatGPT中使用Dall-E 3进行本机绘制。充其量,你可以说,“把这个图像改造成肖像模式”或类似的东西,但照片仍将是最大的1792×1024。(上图中的Dall-E2机器人部分是通过外涂技术生成的,如图所示。)

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

在使用AI创建图像时,请尽可能避免要求其在图像中重现文本。至少要保持较低的期望值。具有终极讽刺意味的是,尽管Dall-E和其他人工智能艺术生成器(如MidRoad)是生成文本的聊天机器人的一部分,但它们实际上对文本一无所知。要非常具体。如果图像中有您想要的文本,请将其放在提示符中的引号中。不过,如果你的人工智能图像中呈现的任何文本完全是胡言乱语,也不要感到惊讶。就目前而言。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

修复又回来了

较老的Dall-E 2提供修复功能,允许您使用橡皮擦工具删除图像的一部分,并将其替换为基于提示的人工智能生成的内容。你甚至可以用一张上传的图片来做到这一点。

虽然目前在Dall-E3中还没有本土的外画,但修复又回来了。

在桌面上,点击任何生成的图像,就可以通过编辑器界面全屏显示–显然,OpenAI不会再将其称为“修复”。聊天将移至右侧。

在顶部,你会看到一个旋转画笔的图标。它使您可以访问可调整大小的选择工具。选择您想要更改的区域。输入一个提示符,指出您想要更改什么,它将在不破坏生成的图像的其余部分的情况下发生。正如你在下面看到的,我从雪地里的一只猫变成了同样雪地里的一只斗牛犬,为了躲避飞碟–但保留了树和灯光等其他细节。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

选择工具是可选的;您可以简单地使用提示将猫更改为狗。但为了将其限制在图像的某个区域,您必须指定文字,否则您可能会让Dall-E3生成一个全新的图像。

你也可以下达“把这张图片变成单色”之类的命令–但即便这样,通常也会生成一张新的图片。要保留旧的,选择工具是必须的。例如,在这个准确的提示下,我得到了这个,显然是侵犯了雷德利·斯科特的外星人异形的版权。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

修复功能的界面与手机版的ChatGPT类似。单击Dall-E 3生成的图像以进入编辑器。从那里,您可以选择编辑以输入提示,或单击选择画笔以仅高亮显示要更改的图像的一部分。您可以在完成更新之前撤消或重做更改。

重要的是,修复/编辑功能不适用于您上传的图像。

下载和编辑

当你准备好拥有你用Dall-E3制作的图像时,点击图像右上角的向下箭头图标,你就可以选择下载WebP版本。或在浏览器中单击鼠标右键选择将图像另存为。

WebP是新的默认图像类型,但它是许多用户不想使用的类型。但是,您始终可以右击Dall-E3图像并将其复制粘贴到图像编辑器中,以另一种格式保存。我们还建议为Chrome或Edge提供将图像另存为类型浏览器扩展,它允许您通过右击选择要下载的图像格式(JPG、PNG或WebP)。

虽然你不能在DALL-E3中画出你的图像,但你仍然可以去https://labs.openai.com/editor,的DALL-E2编辑器(如果你有访问权限),上传图像,并执行修复和外涂。结果并不总是一致的。看到下面的鹅变得抽象起来,它们向右移动,这是被涂得更白的部分。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

如果你想在事后提升你的图像分辨率,你也可以尝试一下像Gigigjpg.com这样的网站,ARC人脸修复软件(它也可以修复人脸),或者商业软件,比如售价99美元的MacOS或Windows版的Gigapixel AI。当然,这些工具也适用于你在其他地方用Dall-E3创建的图像,比如Copilot,或者任何其他创造性的人工智能,比如中途旅行或谷歌的双子座。

你还可以在微软设计器中升级图像–这是由Dall-E 3支持的Copilot生成性人工智能的一部分。如果你在Copilot中制作图像,使用它要容易得多。

吃完Dall-E了吗?

如果你已经试用了付费版本的ChatGPT Plus以获得Dall-E 3,但发现一切都不理想–或者你更愿意雇佣真人(鼓掌!)–你总是可以取消20美元的订阅。单击左下角的您的名字,然后转到我的计划>管理我的订阅>取消计划。

如何使用Dall-E 3 AI艺术生成器从文本创建令人惊叹的图像

有话要说...