如今,用 AI 进行艺术创作正日益兴起,像谷歌、OpenAI和一些其他公司目前都在开发文本生成图像模型,比如 Imagen、Dall·E、Midjourney 等,这些 AI 程序能够制作出令人惊讶的图像艺术。
人们将 AI 生成的图像用到了各种领域,包括用作新闻艺术图和影视概念图等商业用途,一些创作者还将作品直接进行售卖。
值得一提的是,除了可出售根据文本提示生成的作品,制作文字提示本身,也成为创作者的一项能力,甚至是获利手段。
“提示工程师”可以在像 PromptBase 这样的提示交易中心出售文本描述。当在平台上购买提示时,用户会收到一串单词,可以将其粘贴到 Dall-E、Midjourney 等系统中,以在特定的 AI 作画平台生成某种艺术风格或主题的图像。
图 | PromptBase 上一个售价 2.99 美元“街区城市”提示(来源:PromptBase)
据了解,所谓的提示要比一些描述词更复杂。它包括描述预期美学的关键字、场景的重要元素和括号。
买家可以在此基础上添加自己的变量来定制内容。像美甲艺术设计可能包括手的位置、伪摄影镜头的角度,以及调整提示以产生不同美甲风格和主题的说明。
“提示正在成为一种强大的 AI 模型编程新方式,”PromptBase 官网上写到,“但是,很难在网上找到高质量的提示。PromptBase 是一个用于购买和销售高质量提示的市场,这些提示可以产生最佳结果,并为您节省 API (Application Programming Interface,应用程序接口)成本。”据悉, PromptBase 会收取 20% 的佣金。
但为一段文本支付 2~5 美元似乎是一种奇怪的购买交易。那么,制作一个好的商业 AI 提示需要什么,这会花费多大的成本?
对此,一名叫贾斯汀·雷金(Justin Reckling)的设计师告诉媒体,他在 2022 年 4 月进入“提示工程”领域,目前制作了约 50 个提示,一般每天能销售三到五个。
据了解,他必须为每个提示花费 10~15 美元,要卖出大约 5 到 10 个给定的提示才能收支平衡。然后,大多数用户购买提示似乎都是为了娱乐而不是商业目的。
雷金进一步对媒体表示,能够制作比较好的提示,可能有赖于其编程和软件等相关技能背景。而良好的审美能力,也有助于他创建视觉上吸引人的提示。编程经验可帮助理解提示,并指导他更有效地修改它,以达到最终所追求的结果。
具体来说,在对自己想要完成的目标有了大致了解之后,将目标缩小到人物、地点和事物。并尝试构建场景中的核心或主要驱动因素。也可先使用一些粗略的提示,以了解场景可能的外观。
对要创建的图像所涉及的相关知识进行大量学习,也可帮助更好地了解正在尝试创建的场景。
雷金会问OpenAI 研发的大语言模型 GPT-3 一些有关专业问题。例如,制作一个关于某人修指甲的提示,可以问 GPT-3:“有人正在做美甲,解释你所看到的。”这可以从专家那里获得场景更具体的细节。
(来源:PromptBase)
熟悉“超现实”“微距摄影”“电影照明”“长镜头”“中景”等术语也可能对提示制作更有益处。这能使我们更好地了解如何向提示添加深度和细节,并帮助控制距离和焦点。例如,将短语“电影照明”和“黄金时段”添加到上述提示的末尾,以创建更精致、更具体的图像。而且,使用引号来分隔主要思想会对创建提示很有帮助。
另外,提示中的每个单词都有一个与之相关的权重,尝试找出最有效的方法是制作提示的核心技能。提高某个词的权重,能让它以更明显的方式表现出来。
还可以通过添加两个冒号和一个数字来减轻某词的权重。比如,减少“狗”的权重有可能得到食物(热狗)而不是真正的狗。增加其权重,可能会得到一只非常有吸引力或者一只正在寻找水的狗。
值得一提的是,雷金还在现实世界的大量提示数据上,训练了一个 AI 模型。利用该模型可以根据一两个关键字生成示例提示,为创作者提供一些概念想法。虽然它目前还未达到直接生成最终可出售提示的地步,但有了足够的例子,仍可以带来很多创意和娱乐享受。
最后,虽然 AI 艺术和提示制作还存在版权状态较模糊等一些问题,但从长远来看,投资提示制作这项技术或许是值得的,因为该领域正在迅速发展,人们对文本生成图像的兴趣也在日益浓厚。
参考资料:
https://www.theverge.com/2022/9/2/23326868/dalle-midjourney-ai-promptbase-prompt-market-sales-artist-interview
https://promptbase.com/prompt/block-cities