关闭

提示工程在图像处理领域的应用——人人都是提示工程师(11)

发表于:2024-1-18 09:47

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:陈明明 李腾龙    来源:51Testing软件测试网原创

  第6章 提示工程在图像处理领域的应用
  6.1  用 ChatGPT 生成插画
  插画 (illustration)  是指以绘画为主要手段,以文字、图案等为辅 助手段,为书籍、杂志、广告、漫画、动画等媒体制作的图画。插画 通常具有强烈的视觉冲击力和个性化表现,能够传达丰富的情感和意义。
  插画通常用在各种传统或数字媒体中,例如:
  ·儿童绘本、教科书等出版物;
  · 杂志、报纸等新闻媒体;
  · 广告、海报、名片等商业宣传材料;
  · 漫画、动画等娱乐类媒体;
  · 游戏、应用程序等数字媒体。
  插画的应用领域非常广泛,它可以为媒体内容提供更生动、丰富的视觉体验,增强阅读和传达信息的效果。
  传统插画的制作流程包括素描、线稿、上色和修饰等步骤。首先 需要根据创作需求和主题,进行素描和线稿的设计,确定图案的结构 和构图;然后上色,可以使用水彩、油画、粉彩等颜料染色;最后进行修饰和润色,使插图更加完美。
  传统插画的制作通常需要一个或多个插画师来完成,根据插画的  复杂程度和规模,需要的人力资源也有所不同。 一些大规模的插画制  作可能需要多个插画师协作,每个插画师负责不同的部分,如素描、 上色、修饰等。相对于数字插画,传统插画需要更多的时间和精力,但也能够创造出更加自然和独特的效果。
  传统插画的制作是一个相当烦琐的过程,使用ChatGPT 是否可以智能地来生成插画呢?当然是可以的。
  用ChatGPT生成插画的优势主要有以下几点。
  · 节省时间和成本:传统插画采用手工绘制,需要一定的时间和 人力成本,而使用ChatGPT生成插画可以节省制作时间和成 本,提高制作效率。
  · 生成的插画质量高:ChatGPT 是基于大规模的数据集训练出 来的,可以生成高质量的插画,尤其在色彩和构图上表现较 出色。
  · 涵盖多种风格:ChatGPT 可以生成如卡通、写实、手绘等风格的插画,以满足不同的场景和需求。
  · 支持个性化定制:ChatGPT 可以根据用户输入的文字内容和风格偏好要求进行生成,实现个性化定制。
  · 降低技术门槛:制作传统插画需要具备一定的绘画技巧和经 验,而使用ChatGPT 生成插画不需要这些技能,只需要输入 文本和选择风格即可。
  · 环保、可持续: 制作传统插画需要消耗大量的纸张、颜料等材 料,而使用ChatGPT 生成插画是基于数字化的方式进行的,对 环境更加友好。
  综上所述,使用ChatGPT 生成插画具有许多优势,将会在广告设 计、图书出版、电影动画、游戏开发等领域发挥重要作用,帮助设计师和创作者更加高效地完成作品。
  ChatGPT 到底是如何帮助插画师来进行创作的?我们看一个具体 的例子。假设我们要为儿童图书做一幅插画,插画要体现的是一只小白兔在吃胡萝卜,风格是手绘的。
  因为目前 ChatGPT并不能直接输出图片,所以这里要介绍一个绘 图工具Midjourney 。这个工具可以将文字提示直接转化为图片。我们第一次在Midjourney 中输入以下内容。
  A little rabbit eating a carrot.
  Midjourney 第一次的输出如图6.1 所示。
图6.1  Midjourney 第一次的输出
  我们发现 Midjourney 可以生成很好的图片,但是并不满足我们需要的手绘风格的要求,因此我们再次向 Midjourney 中输入以下内容。
  A small rabbit eating carrots,the style is hand-painted.
  Midjourney 第二次的输出如图6.2所示。
图6.2 Midjourney 第二次的输出
  我们发现 Midjourney 还没有生成手绘风格的插画。怎么办呢?因为我们的提示没有设计好,所以我们可以让ChatGPT 帮助我们生成对应的提示。我们先在ChatGPT 中输入如下内容。
  生成一幅小白兔吃胡萝卜的手绘风格图片的提示。
  ChatGPT 输出如下内容。
  Generate a hand-drawn style picture of a bunny eating a carrot.
  我们发现,ChatGPT并不能正常工作,只进行了文字翻译,这是为 什么呢?因为我们的输入太模糊了, ChatGPT 认为我们只想翻译输入的内容而已,并不想生成对应的 Midjourney 提示。我们调整一下输入。
  如果你想在 Midjourney 中画一幅小白兔吃胡萝卜的手绘风格图片,那么你应该生成什么样的提示?
  ChatGPT 输出如下内容。
  为了生成一幅小白兔吃胡萝卜的手绘风格图片,您可以使用以下提示。
  “画一张手绘风格的小白兔吃胡萝卜的图片。 小白兔身体的颜色为 白色,脸和耳朵的颜色为粉色,眼睛像大大的黑色圆圈,嘴巴像一个 小三角形,有两根长长的胡须。它正用两只手拿着一根胡萝卜,胡萝 卜的颜色是橙色,形状像一个长长的圆锥形。背景可以是绿色的草地或蓝色的天空。”
  这段提示详细描述了小白兔的外观特征、动作和背景,可以帮助模型更好地理解您的需求,并生成符合预期的手绘风格图片。
  这次我们发现ChatGPT 正确输出了提示,我们将这段提示翻译成以下英文并输入 Midjourney 中。
  Draw a hand-drawn style picture of a little white rabbit eating a carrot. The white rabbit has a white body color,a pink face and ear color,large black circles for eyes,a small triangular mouth,and two long whiskers.It is holding a carrot with two hands,which is orange in color and shaped like a long cone.The background can be a green grass or a blue sky.
  Midjourney 第三次的输出如图6.3所示。
图6.3 Midjourney 第三次的输出
我们发现图6.3已经符合我们要求的手绘风格了,看起来非常不错。
虽然使用ChatGPT 可以生成高质量插画,但是也存在一些限制和不足。以下是一些可能的限制和不足。
  ·样式和风格限制: 用 ChatGPT 生成的插画的样式和风格可能 受到其训练数据的限制。如果训练数据中缺乏某些样式或风 格,生成的插画可能无法满足用户的需求。此外,用户无法像 手绘插画一样直接对每个元素进行调整。
  · 种类限制:目前用ChatGPT 可以生成的插画种类还比较有限, 主要是人物、动物、风景等。对于一些特殊的插画种类,如科技、工业等,用ChatGPT 可能无法生成。
  · 版权问题:生成的插画可能涉及版权问题,因为ChatGPT 是 通过学习其他艺术家创作的插画而得到灵感的。因此,如果生 成的插画与其他人的作品相似度过高,就可能会侵犯他人的版 权。同时,生成的插画也可能违反法律,例如,涉及色情、暴力等内容。
  · 语言输入限制: 目前用ChatGPT生成插画仍然需要基于自然语言的输入,而自然语言的表达能力可能会受到限制。
  · 硬件资源不足: ChatGP T 模型需要大量的计算资源和存储资源 来进行训练与推理,因此对于个人用户和小型公司来说,可能会面临硬件资源不足的问题。
  总的来说,用 ChatGPT生成插画的能力和质量已经很出色,但是在某些方面仍然存在一些限制和不足,需要不断改进和优化。
版权声明:51Testing软件测试网获得作者授权连载本书部分章节。
任何个人或单位未获得明确的书面许可,不得对本文内容复制、转载或进行镜像,否则将追究法律责
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号