提示工程在图像处理领域的应用——人人都是提示工程师（11）

发表于：2024-1-18 09:47

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：陈明明李腾龙来源：51Testing软件测试网原创

提示工程师

　　第6章提示工程在图像处理领域的应用

　　6.1 用 ChatGPT 生成插画

　　插画 (illustration) 是指以绘画为主要手段，以文字、图案等为辅助手段，为书籍、杂志、广告、漫画、动画等媒体制作的图画。插画通常具有强烈的视觉冲击力和个性化表现，能够传达丰富的情感和意义。

　　插画通常用在各种传统或数字媒体中，例如：

　　·儿童绘本、教科书等出版物；

　　· 杂志、报纸等新闻媒体；

　　· 广告、海报、名片等商业宣传材料；

　　· 漫画、动画等娱乐类媒体；

　　· 游戏、应用程序等数字媒体。

　　插画的应用领域非常广泛，它可以为媒体内容提供更生动、丰富的视觉体验，增强阅读和传达信息的效果。

　　传统插画的制作流程包括素描、线稿、上色和修饰等步骤。首先需要根据创作需求和主题，进行素描和线稿的设计，确定图案的结构和构图；然后上色，可以使用水彩、油画、粉彩等颜料染色；最后进行修饰和润色，使插图更加完美。

　　传统插画的制作通常需要一个或多个插画师来完成，根据插画的复杂程度和规模，需要的人力资源也有所不同。一些大规模的插画制作可能需要多个插画师协作，每个插画师负责不同的部分，如素描、上色、修饰等。相对于数字插画，传统插画需要更多的时间和精力，但也能够创造出更加自然和独特的效果。

　　传统插画的制作是一个相当烦琐的过程，使用ChatGPT 是否可以智能地来生成插画呢?当然是可以的。

　　用ChatGPT生成插画的优势主要有以下几点。

　　· 节省时间和成本：传统插画采用手工绘制，需要一定的时间和人力成本，而使用ChatGPT生成插画可以节省制作时间和成本，提高制作效率。

　　· 生成的插画质量高：ChatGPT 是基于大规模的数据集训练出来的，可以生成高质量的插画，尤其在色彩和构图上表现较出色。

　　· 涵盖多种风格：ChatGPT 可以生成如卡通、写实、手绘等风格的插画，以满足不同的场景和需求。

　　· 支持个性化定制：ChatGPT 可以根据用户输入的文字内容和风格偏好要求进行生成，实现个性化定制。

　　· 降低技术门槛：制作传统插画需要具备一定的绘画技巧和经验，而使用ChatGPT 生成插画不需要这些技能，只需要输入文本和选择风格即可。

　　· 环保、可持续：制作传统插画需要消耗大量的纸张、颜料等材料，而使用ChatGPT 生成插画是基于数字化的方式进行的，对环境更加友好。

　　综上所述，使用ChatGPT 生成插画具有许多优势，将会在广告设计、图书出版、电影动画、游戏开发等领域发挥重要作用，帮助设计师和创作者更加高效地完成作品。

　　ChatGPT 到底是如何帮助插画师来进行创作的?我们看一个具体的例子。假设我们要为儿童图书做一幅插画，插画要体现的是一只小白兔在吃胡萝卜，风格是手绘的。

　　因为目前 ChatGPT并不能直接输出图片，所以这里要介绍一个绘图工具Midjourney 。这个工具可以将文字提示直接转化为图片。我们第一次在Midjourney 中输入以下内容。

　　A little rabbit eating a carrot.

　　Midjourney 第一次的输出如图6.1 所示。

图6.1 Midjourney 第一次的输出

　　我们发现 Midjourney 可以生成很好的图片，但是并不满足我们需要的手绘风格的要求，因此我们再次向 Midjourney 中输入以下内容。

　　A small rabbit eating carrots,the style is hand-painted.

　　Midjourney 第二次的输出如图6.2所示。

图6.2 Midjourney 第二次的输出

　　我们发现 Midjourney 还没有生成手绘风格的插画。怎么办呢?因为我们的提示没有设计好，所以我们可以让ChatGPT 帮助我们生成对应的提示。我们先在ChatGPT 中输入如下内容。

　　生成一幅小白兔吃胡萝卜的手绘风格图片的提示。

　　ChatGPT 输出如下内容。

　　Generate a hand-drawn style picture of a bunny eating a carrot.

　　我们发现，ChatGPT并不能正常工作，只进行了文字翻译，这是为什么呢?因为我们的输入太模糊了， ChatGPT 认为我们只想翻译输入的内容而已，并不想生成对应的 Midjourney 提示。我们调整一下输入。

　　如果你想在 Midjourney 中画一幅小白兔吃胡萝卜的手绘风格图片，那么你应该生成什么样的提示?

　　ChatGPT 输出如下内容。

　　为了生成一幅小白兔吃胡萝卜的手绘风格图片，您可以使用以下提示。

　　“画一张手绘风格的小白兔吃胡萝卜的图片。小白兔身体的颜色为白色，脸和耳朵的颜色为粉色，眼睛像大大的黑色圆圈，嘴巴像一个小三角形，有两根长长的胡须。它正用两只手拿着一根胡萝卜，胡萝卜的颜色是橙色，形状像一个长长的圆锥形。背景可以是绿色的草地或蓝色的天空。”

　　这段提示详细描述了小白兔的外观特征、动作和背景，可以帮助模型更好地理解您的需求，并生成符合预期的手绘风格图片。

　　这次我们发现ChatGPT 正确输出了提示，我们将这段提示翻译成以下英文并输入 Midjourney 中。

　　Draw a hand-drawn style picture of a little white rabbit eating a carrot. The white rabbit has a white body color,a pink face and ear color,large black circles for eyes,a small triangular mouth,and two long whiskers.It is holding a carrot with two hands,which is orange in color and shaped like a long cone.The background can be a green grass or a blue sky.

　　Midjourney 第三次的输出如图6.3所示。

图6.3 Midjourney 第三次的输出

我们发现图6.3已经符合我们要求的手绘风格了，看起来非常不错。

虽然使用ChatGPT 可以生成高质量插画，但是也存在一些限制和不足。以下是一些可能的限制和不足。

　　·样式和风格限制：用 ChatGPT 生成的插画的样式和风格可能受到其训练数据的限制。如果训练数据中缺乏某些样式或风格，生成的插画可能无法满足用户的需求。此外，用户无法像手绘插画一样直接对每个元素进行调整。

　　· 种类限制：目前用ChatGPT 可以生成的插画种类还比较有限，主要是人物、动物、风景等。对于一些特殊的插画种类，如科技、工业等，用ChatGPT 可能无法生成。

　　· 版权问题：生成的插画可能涉及版权问题，因为ChatGPT 是通过学习其他艺术家创作的插画而得到灵感的。因此，如果生成的插画与其他人的作品相似度过高，就可能会侵犯他人的版权。同时，生成的插画也可能违反法律，例如，涉及色情、暴力等内容。

　　· 语言输入限制：目前用ChatGPT生成插画仍然需要基于自然语言的输入，而自然语言的表达能力可能会受到限制。

　　· 硬件资源不足： ChatGP T 模型需要大量的计算资源和存储资源来进行训练与推理，因此对于个人用户和小型公司来说，可能会面临硬件资源不足的问题。

　　总的来说，用 ChatGPT生成插画的能力和质量已经很出色，但是在某些方面仍然存在一些限制和不足，需要不断改进和优化。

查看《人人都是提示工程师》全部连载章节

任何个人或单位未获得明确的书面许可，不得对本文内容复制、转载或进行镜像，否则将追究法律责

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

送祝福，领好礼

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选