慢一点儿招聘,提示工程师 Prompt Engineer这个岗位终将消失

每隔一个月我就会出门去“采风”,主要是想了解一下创业圈一线朋友们的最新信息。

上周五我到上海见了五位朋友。其中一位老朋友和我交流了他的新事业,是一个 AI 应用项目。我的朋友提到眼下公司最重要的事情之一是要赶紧招聘提示工程师 “prompt engineer”。

我的脑海中闪过两天前的新闻:OpenAI 推出了 DALL-E 3。

我不是工程师,但可能也正因为此,经由对 DALL-E 3 的一瞥,我的直觉告诉我:OpenAI 的趋势目标似乎是要去 “Prompt” 化。

因为对于包括我在内的这种不是技术出身的普通大众,我认为需要精准的 Prompt 描述是一种未完成的产品形态。我不认为萨姆.奥特曼个人会觉得每个人都必须成为 Prompt 大师。至少,从目前文生图模型的进化来看是这样。

“所以招聘的节奏是不是慢点儿比较好?不要一下子招太多。”我和我的朋友说:“招/裁人的成本很高。”


(一)

当然,我的直觉不是空穴来风。

9 月 21 日,OpenAI 推出了文生图模型 DALL-E 的升级版本 DALL-E 3。下面是 OpenAI 对其新版本的评价。

“DALL-E 3 比我们以前的系统了解更多的细微差别和细节,让您可以轻松地将您的想法转化为极其准确的图像。”

简单讲,DALL-E 3 的升级可以分为两部分:

1,第一部分是,对提示词有了更好的理解能力。

我们需要掌握提示工程是因为:通常从文本到图像系统,会因为忽略文字或者描述而出现缺陷。但 DALL-E 3 在这方面的能力有了重要飞跃,它消除了提示工程的复杂性。

OpenAI 称:“DALL-E 3 可以准确地表示具有特定对象的场景以及它们之间的关系。” 如下图,这是 OpenAI 博客文章中的一个示例:

需要注意的是:目前,包括 Midjourney 等在内的文生图模型,都没有解决需要精确提示词的这一挑战——如果是单独的角色和物体,图像很容易生成,并且生成图像的质量也很高,但如果是不同的物体,AI 系统就必须遵循提示词中所描述的特定关系的场景。

第二,OpenAI 把 DALL-E 3 与它的 ChatGPT 连接了起来。

这样做的好处是:可以让 DALL-E 3 插上 ChatGPT 的翅膀——因为 ChatGPT 所具有的出色的文字能力,可以帮 DALL-E 3 理解和生成更加准确的图像。

啥意思呢?比如说,我们只需要要求 ChatGPT 给出提示词,聊天机器人就会写出一个词语很多的段落来供 DALL-E 3 遵循。而 DALL-E 模型对于较长的句子效果更好。

为此 OpenAI 称:与聊天机器人的这种联系,可以让更多人能够创作 AI 艺术,因为他们已经可以不必非常擅长于给出提示词。

也就是说:如果 OpenAI 对 DALL-E 3 的描述是真实的,那么某种程度上,DALL-E 3 已经攻破了限制利用 AI 来创建精美图像能力的壁垒。至少对于文生图模型是这样,消除提示工程的里程碑似乎已经实现。



(二)

当然,上周六下午回到家后,我又做了大量的搜索来验证我的直觉。

下面是我的一些发现:

1,不久之前,萨姆.奥特曼曾经预测:Prompt engineering 提示工程是生成式 AI 的一个临时阶段。

2,Huggingface 的研究员 Sanh 认为:提示工程师的角色是暂时的。毕竟,最终您不应该通过输入一串复杂的常用短语来与聊天机器人进行交互。你应该只是和它交谈。

Sanh 还将一些直接与模型打交道的提示工程师,比作为是“公关部门为了某人准备接受媒体采访”,其作用是指导这个系统,就有点儿像是一个未经修饰的民选候选人,以便它“表现得正确”。

3,这两天,其实英文网站上已经慢慢出现一些英文博客,讲述了和我一样的想法。大家有兴趣的可以搜索一下。



(三)

总结,我最终想表达的是:

过去一段时间,提示工程师这个职业几乎是科技界最热门的新工作,不仅年薪优渥,甚至哪怕你只是掌握了相关技能,你都可以写到你的个人简历里。

但是恐怕,除了只是在一些非常专业的领域里,比如说医疗保健系统等等,还会在相当长的一段时间内,还需要让训练有素的人来与 AI 进行交互,也就是做提示工程。但是可能,并非所有的领域都如此。

其中一些,可能一段时间以后或者几年之后就不存在了。

仅供大家参考。


我平时主要在知识星球写美国科技界的内容,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

发表评论

邮箱地址不会被公开。 必填项已用*标注