伊隆.马斯克正式推出其人工智能公司 xAI

大战打响,根据美媒的报道:几小时前,伊隆·马斯克正式推出了其人工智能公司 xAI 的官网,还推出了一个 Twitter 帐户,账号为 @xAI,以与其曾经支持的 OpenAI 正式竞争。

马斯克还在 Twitter 中表示,他推出 xAI 是“为了理解现实”。

xAI 的官网见:https://x.ai/

根据该官网:xAI 是一家独立于 X Corp 的公司。X Corp 是 Twitter 的控股公司。马斯克将在 xAI 里领导一个由 12 人组成的研究团队,其中包括:前 DeepMind 的研究员 Igor Babuschkin、前谷歌员工 Christian Szegedy,以及前微软研究员 Greg Yang。

今年 2 月,马斯克开始为这一项目招募人员。

该项目主要旨在对 OpenAI 的 CharGPT 做出“反唤醒”回应。马斯克曾多次批评 OpenAI 安装限制 ChatGPT 响应以避免传播错误信息或冒犯用户的保护措施。

相关链接:神秘的 OpenAI 员工一年能够拿到多少钱?


说明:我平时主要在知识星球写美国科技界的内容,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

除了扎克伯格的 Threads,这几家创业公司也想推翻 Twitter

7 月 5 日,扎克伯格旗下的 Instagram 推出了 Twitter 的竞品 Threads。基于 Instagram 作为世界级社交网站所拥有的庞大用户数,根据 CNBC 的最新报道:

五天后,Threads 的用户数就突破了 1 个亿(目前 Twitter 用户数是 3 亿多),且直接拖累了 Twitter 用户流量的放缓。见下图,这是 Cloudflare 的 CEO 周日分享的一张有关 Twitter 访问量的截图:

这件事情最有意思的地方在于:

我掐指一算:实际上自去年 4 月伊隆.马斯克宣布要买 Twitter 以来,美国市场上已经有至少 5 家公司正在试图推翻 Twitter。

其中最后两家,还是刚刚拿到的种子轮。

换句话说:我认为很有可能,美国市场上将迎来一轮挑战 Twitter 的融资潮。

下面,我就和大家介绍一下正在与 Twitter 竞争的四家社交创业公司,并说一说我对 Threads 的看法。


(一)

首先,我还没有在 Threads 上发太多帖子,但是我仔细研究了 Threads 的产品形态。

我有三个感觉:

第一个是:在所有试图成为 Twitter 杀手的应用中,Threads 可能是我们大家都将开始使用的那一个。

根据 Demandsage 的数据:目前,Instagram 的月活用户数已经超过了 23.5 亿。那么,哪怕 Instagram 的转化率只有 5%,Threads 的月活用户数也能够轻松过亿。

第二,我认为 Threads 最终塑造出来的,可能不是 Twitter。因为基于 Instagram 甜美与岁月静好的风格,Threads 也很可能会成为一个美国的“中产阶级”平台。

而 Twitter 的核心用户,却是那些非常犀利的、刀锋一般的意见领袖。Twitter 实际上是一个非常头重脚轻的“强人”分发工具,少数人在其中拥有了大量的资源。换句话说,推特是这些少数人的扩音器。

但 Threads 的中产性质也意味着:在 Threads 这个平台上,每个人都能够分得一点爱,使整个平台更具有弹性和商业价值。

第三,我认为 Threads 很像美国版的微信。

当年 Instagram 的发展,就是基于手机通讯录列表起来的。而 Threads 可以直接导入 Instagram 的关注者列表。

其次,Threads 的第一逻辑是文字。而且,它相当于是把 Instagram 的第一逻辑和唯一逻辑——图片与视频等,变成了它的第二逻辑。也由此,Threads 的功能结构可以包裹 Instagram。

实际上我有一种预感:同时使用 Instagram 与 Threads 的人,之后可能会越来越多地使用 Threads,反而会慢慢忽视 Instagram(非常注重用图片记录的人除外)。

但这对扎克伯格却未必是件坏事。因为一个用户一天发一张照片,已经很了不起了。但是想想基于文字的微信,因为使用体验更轻,一天发多条朋友圈都不是问题。

这是我的 Threads,同志们快来加我

(二)

下面,我们再来看一看试图推翻 Twitter 的四家创业公司。

其中有一家,甚至已经在目前的美国社交应用圈子里大名鼎鼎。而且它,也很可能是这五家公司中最有趣的一个。

为更好地与 Meta 巨头竞争,它也在本月火速地又融了一轮 800 万美金的种子轮。这一轮的领投方,是加州的一个种子基金。该基金的 LP 之一,是红杉资本。

问题是:这些美国的 VC 们为什么会对社交网站感兴趣?他们如何思考这些社交网站与巨无霸 Meta 的竞争关系?……

本文剩余内容的主要摘要如下:

1,目前美国市场上与 Twitter 竞争的是哪四家创业公司?

2,其中有一个项目,被誉为“最有 Twitter 的原始精神”,同时又是一个去中心化的社交项目。这是哪一家创业公司?他们的愿景是什么?

3,美国 VC 如何看待新一代社交网络应该是什么样子?


说明:因为各种各样的原因,我在官网写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

神秘的 OpenAI 员工一年能够拿到多少钱?

我想研究一下 OpenAI 的薪酬结构,主要基于两方面原因:

第一,目前,美国 AI 领域的人才报酬已经贵到离谱。第二,随着 OpenAI 继续引领人工智能的进步,OpenAI 很可能会在世界范围内重新定义科技业的竞争性薪酬。

但结果我发现:OpenAI 对于如何运作自己的薪酬体系和估值方式,极为保密。

并且即便是在硅谷,OpenAI 的薪酬结构也是非常独一无二的。

下面,就让我们一起来看一下 OpenAI 是如何思考和塑造其薪资体系的。

在此之前,我们需要再来回顾一下 OpenAI 的使命和其非常特殊的前世来生:

OpenAI 本是一家非盈利组织。为解决如何从谷歌、Facebook 等科技巨头手中抢夺 AI 人才以及公司发展所需要的巨额资金问题,2019 年 OpenAI 重组公司结构——母公司为非盈利组织,子公司为盈利性公司,同时开始采用“盈利上限”模式。

也就是:把 OpenAI 早期投资者的回报,限制在其原始资本的 100 倍,以防止投资者驱动公司只关注利润。并且后面的投资者,回报上限只会更低。

根据 OpenAI 的博客文章,“OpenAI LP 的基本理念是:如果我们成功完成使命,投资者和员工都可以获得上限回报,这使我们能够筹集投资资金并通过类似初创公司的股权吸引员工。但任何超出了这个数额的回报——如果我们成功了,我们预计会产生比投资 OpenAI LP 或在 OpenAI LP 工作的人更多的价值——都归原来的 OpenAI 非盈利实体所有。”

下面,就是 OpenAI 独一无二的薪酬体系。

(一)首先,与硅谷其他公司类似,除了提供标准的医疗、牙科、心理健康福利之外,OpenAI 还提供以下服务:

  • 401(k) 计划,4% 匹配
  • 每年无限次休假和 18+ 公司假期
  • 带薪育儿假(20 周)和计划生育支持
  • 年度学习和发展津贴(每年 1,500 美元)

不过,与所有硅谷大科技公司和创业公司不同的是:

OpenAI 的签约奖金非常稀有,而且没有目标绩效奖金,在赔偿方面,也几乎没有谈判的余地。

实际上,OpenAI 的 Offer 由最简单的两个部分组成:基本工资 + 股权。

这里,基本工资是指员工每两周会收到的现金工资。大多数员工每年的基本工资为 30 万美元。

“股权”方面,则 OpenAI 不叫“股权”,而称其为是“利润参与单位”或者是“PPU”。

见附件图一,这是 OpenAI 最近的 Offer 报价。……

本文剩余内容的主要摘要如下:

OpenAI 员工每年的总薪酬是多少美元?OpenAI 采取了什么非常特殊的薪资结构?为什么要采用这种薪资结构?员工的PPU 流动性如何?PPU的风险性如何?


说明:因为各种各样的原因,我在官网写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

Coatue 46 页 PPT 中最有趣的一个问题

6 月 30 日,对冲基金 Coatue 发表了长达 46 页的 PPT <EMW/2023>,从美股二级市场一路讲到了一级市场。由于我本身就是美股交易者,所以 PPT 里的大部分观点,我其实觉得平淡无奇。但是里面有一张图,我认为提出了 Coatue 全部观点中最有趣的一个问题。让我们先来看一下 Coatue 的主要观点。如下:


(一)

从二级市场中学到的

“世界正变得更具弹性。作为结果之一,美股已经反弹。但美股内部也很复杂:实际上,只有科技股在反弹,其他像布伦特原油股、地区银行股、运输类股、零售类股票等经济敏感行业,都表明压力依然存在。

此外,即便是在科技股里,也只有七大巨头—— MANTA + Meta + 苹果——表现出色,其他的都不怎么样。

自由货币的时代已经结束,市场需要公司实现盈利性增长,像扎克伯格等领先的创始人正在努力转型(小扎不再在财报会议上讲元宇宙,而是开始讲效率);而如黄仁勋这种厉害的创始人则已经得到了奖励。

市场正感受到一个潜在的新超级周期的开始。一般来说,每个主要周期都有一个突破性时刻。例如移动时代,是 2012 年苹果发布 iPhone 4S;云时代,则是 2014 年亚马逊 AWS 的市场规模突破了 1500 亿美元。那么英伟达今年二季度的收益,是否代表着人工智能时代的突破性时刻呢?

总结:人工智能可能是未来十年经济的生命线。

紧接着,Coatue 从二级市场转到了一级市场,提出了如下几个观点:


一级市场的情况

市场上有太多的独角兽公司需要太多的钱了。但是相比于投资独角兽,今天的投资者有太多替代性的投资选择。而今天公司退出的渠道也很有限——IPO 少、并购少、VC 向 LP 的募资减少。在这种大环境下,公开市场与私人市场里许多公司的估值已经被大减记,甚至 Klarna 已经被减记了 85%。但即便如此,仍有大量的独角兽公司没有被重新定价,他们甚至可能永远都不会拿到新融资。

那么,这对创始人意味着什么呢?

意味着:今天的创始人,必须同时关注两个指标——“效率”和“规模化”,而公司里的关键角色,不再是 2021 年时候的“增长官”,也不是 2022 年时候的“首席财务官”,而是变成了 2023 年的“首席战略官/并购主导者/业务开发人员。”

这种情况下,两个问题是:1,创始人如何赢得资金流动性的途径?2,人工智能可以帮助创始人改变这场游戏吗?


(二)

让我们先来看第二个问题:人工智能能够帮助创始人改变这场游戏吗?

给到大家今天刚刚出炉的两组数据:

1,的的确确,今年二季度美国 VC 投资总额显示:风险投资资金总量继续在减少。

根据 Crunchbase 的最新数据:今年二季度,美国创业公司筹集的总资金量仅为 276 亿美元,环比下降了约 40%;同比,则更是大幅下降了 55%。

需要注意的是:从去年的 1 月开始,我就一直在看数字的下降

也就是说:这实际上是美国整个 VC 生态系统连续第六个季度的数据下降(可怕)。

2,但是另一方面,令人惊奇的是:人工智能分支继续一枝独秀,甚至上周还进入了一个 AI 风投史上的拐点。

上周,投资交易金额最大的 10 个交易里面,有三个是人工智能公司,分别是:Inflection AI(融了 13 亿)、Runway(融了 1.41 亿)、Typeface(融了 1 亿)。

这印证了 Coatue 的核心观点:人工智能或许可以帮助创始人改变这场游戏。包括如:创始人可以通过 AI 为现有业务带来新的推动力、创始人可以把业务完全转向 AI、创始人可以扩展产品套件以抓住 AI 机会、甚至是创始人可以和新的 VC 重新开始业务,等等。


(三)

现在,再让我们来看一下 Coatue 提出的第一个问题,也就是我觉得整个 Coatue PPT 中最有趣的一个问题:创始人如何赢得资金流动性的途径呢?

请看下图,在这份 PPT 的第 37 页:

这张图表明,今天的创业公司,实际上是在和投资者包括 LP 的下面三种资本部署方式进行竞争:

  • 无风险利率 ( 5% )
  • 买 Meta 或者谷歌这样的大型科技公司的股票 ( 20× P/E )
  • 买 AI 增长/ 英伟达的股票 ( 50× P/E)

换句话说:如果你是投资者,你会把钱放在哪里呢?


大家可以到我的知识星球获取 Coatue 的这份 46 页的 PPT。


说明:文章首发公众号,因为各种各样的原因,我在公众号写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

美国 AI 创业公司的新难题:有钱,但是缺数据

随着时间的推移,美国人工智能产业的附加值重心,已经悄悄发生了转移。

根据《华尔街日报》的最新报道:正在筹集数十亿美元的生成式 AI 创业公司,如果没办法获得正确的数据,那么它们可能已经走向失败。

风投机构 Primary Venture Partners 的联合创始人兼普通合伙人布拉德.斯夫鲁加指出:

“我们已经看到很多公司可能正在寻求出色的 AI 应用,但他们无法访问能够让他们构建强大应用程序的数据,更加不用说可以帮助他们的专有数据了。”

换句话说:当市场上,构建实际的模型已经变得类似于可以购买的商品时,真正的价值变成了数据。拥有正确的数据,现在可能比任何时候都更加重要。


(一)

这里的逻辑是:目前,许多 AI 创业公司都希望能在如金融或医疗保健等细分领域建立起小众的 AI 模型,但因为他们缺乏品牌认知度和社会认同,这些创业公司要获得垂直行业的培训数据集并不容易。

在这方面,大公司可能更具优势,因为在如何处理数据方面,大公司已经赢得了大客户们的信任。

例如根据《华尔街日报》的报道:安永全球有大量的交易数据,每天都有生成式 AI 创业公司找上门来。但安永全球担心:如果把自己的专有数据用于训练外部模型将会发生什么?

“谁拥有这些数据?当我们训练模型时,我们对这个模型的访问权限是什么?其他人还能如何使用这个模型?数据是由我们带来的知识产权的一部分。” 安永全球指出。

要解决类似的 IP 问题,一种对策是:创业公司可以通过仅仅是根据每个客户的数据,来为每个客户训练不同的模型。

例如 TermSheet 就是用这种策略来构建 Ethan 产品策略的。后者是一种生成式 AI 模型,可以为房地产开发商、经纪人和投资者回答行业的问题。但是 TermSheet 的 CEO 罗杰.史密斯也表示,即便客户同意这一点,他们也需要教育客户和一些说服力。  

此外,对网络安全的担忧,也是大客户公司不愿意选择创业公司的原因。

如金融服务公司 Truist 的首席数据官特蕾西.丹尼尔斯就表示,在数据安全方面,他们信任更加大的供应商,因此只选择与大技术供应商而非创业公司一起探索生成式 AI 应用。

第三,甚至在某些情况下,垂直行业的大客户会要求生成式 AI 创业公司支付巨大的资金额或者是公司股权。如生成式 AI 公司 Veesual 可以生成人们试穿衣服的图像,他们最初利用互联网上的公共图像进行训练,但在努力让大零售商同意交出他们数据以增强模型时,就因为上述原因失败了。

第四种情况,则是在技术上很难实现。

如 PatentPal 是一家帮助律师事务所起草专利申请的生成式 AI 初创公司,他们接受过公开专利申请方面的培训。他们有机会继续根据加密或匿名的实际客户反馈,来训练其模型,从而使他们的工具更加准确。但这种过程十分复杂,因为反馈必须与高度敏感和机密的数据(包括商业机密)分开。 

然而与此同时,生成式 AI 创业公司的竞争已经趋向白热化。

如果从资金注入规模看,根据《华尔街日报》引用 PitchBook 的数据:从去年 2022 年到今年的前五个月,生成式 AI 创业公司的风险投资资金规模已经从 48 亿美金增长到了 127 亿美元。

因此,为了确保能够在某些利基市场中获得更多数据,生成式 AI 创业公司的压力已经越来越大。

Struck Capital 的创始人兼执行合伙人亚当.斯特拉克指出:一些初创公司正竞相相互竞争,以确保在某些利基市场内获得更多数据。

“如果你相信有一个专有数据集,你就想在他们之前得到它,然后,协商排他性。从这个意义上说,这几乎变成了一场军备竞赛。”他说。


(二)

有意思的是,上述现状也不禁让我想到:似乎,市场上真的缺乏一个数据的公开交易市场。

实际上在 2018 年或者更早的 2017 年,我在美国流媒体公司 Netflix 的一位朋友就和我聊起过他的这个创业想法:做一个数据的公开交易市场。不过,始终没有合适的产品形态,包括如何让公司自愿交出自己的数据。

从这个角度讲,前两天的一个新闻——OpenAI 正在考虑推出一个交易市场——就非常值得关注。

需要注意的是:在 ChatGPT 的插件计划几乎失败之后,根据美媒的报道:

OpenAI 正在考虑推出一个交易市场,以让客户可以将他们根据自己需求定制的人工智能模型出售给其他公司。换句话说:这个交易市场将为企业提供一种访问前沿大语言模型的方法,并托管客户们构建的 OpenAI 模型的微调版本。……

本文剩余内容的主要摘要如下:

1,为什么 OpenAI 考虑推出一个交易市场?

2,这个交易市场有什么方式可以打通公司之间的数据共享和交易吗?


说明:因为各种各样的原因,我在官网写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

萨姆.奥特曼:请不要相信萨姆.奥特曼

上周四,OpenAI 的 CEO 萨姆.奥特曼在旧金山举行的彭博科技峰会上发表了讲话,下面是他在这一活动中谈到的最重要的七个内容:


1,关于未来人工智能带来的生存威胁: 

“我们正处在一条指数曲线上,而且,是一条相对陡峭的曲线。(但)人类对指数曲线的直觉非常糟糕。考虑到我们都有这个弱点,我认为我们必须真正强迫自己说:

好吧,GPT-4 不像您所说的那样存在风险,但是,我们对 GPT-9 有多大的把握? 

如果有可能,即便情况很糟糕的可能性很小,也值得我们关注。” 

2,但是为什么我们不应该停止开发这种有潜在危险的技术: 

“我认为这里有巨大的好处,你知道地球上的每个人都有机会获得比今天任何人都要更好的优质教育、医疗保健,并使其真正地在全球范围内提供。 

这将是变革性的。我们将看到的科学进步——我坚信,生活质量的真正可持续改善来自于科学技术的进步。 

我认为结束贫困是一件好事。也许,你认为阻止一项可以做到这一点的技术是一件好事。但我个人不这么认为。” 

3,关于呼吁对人工智能进行监管,并指责 OpenAI 只是为了保护自己当前的领导地位而提出需要监管这种说法:

 “我们不认为低于某个非常高的能力门槛的小创业公司和开源模式应该受到大量的监管。我们已经看到了那些试图过度监管技术的国家的情况。我不认为那是我们在这里想要的。” 

“你可以,比如,指出我们在这里试图做监管俘虏或其他什么,但我只是认为这是(一个)透明的、智力上不诚实的反应。” 

“我认为,人们培训的模型已经远远超过我们今天任何模型的规模。对于已经超过了某些能力门槛的模型,我认为你应该需要通过一个认证过程来实现。我认为应该有外部的审计和安全测试,我们对其他很多关心安全的行业都是这样做的。” 

4,关于与中国合作制定人工智能发展的安全规则: ……

剩余全文需要到我的知识星球阅读。


说明:因为各种各样的原因,我在官网写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

是什么造就了企业家?7 个关键人格特征

我在美国最荒唐的一次经历是:开车中途被一位非常紧张的美国女警察拦下,她掏出了枪。我遵照她的指示把车开到最右边,把两手平放在膝盖上,以向她显示我没有枪,并且我不会反抗。 

很显然,我在驾驶中违规了——当时,我被大脑中一个迷人的想法迷住了,以至于开出了类似酒驾般摇摇晃晃的车形。我酒精过敏,几乎从不喝酒,但这不妨碍警察认为我是一个神经病。 

今天,分享给大家一篇近期我看到的最有意思的文章,文章讲述了哪些人格特征与人生经历会有更高的概率让某些人成为自雇人士或者是企业家/创业者。 

其中,有一项因素触目惊心,那就是:患有双相情感障碍、多动症与强迫症的人。我知道很多创业者都有心理问题,但是我没想到这一项的排名居然如此之高,挤进了 1/7。 

需要注意的是:本文作者研究了世界各地跨行业、跨阶段的公司,从星巴克到 Stripe、从 YC 到 Flexport,从 Rappi 到 Kaspi,从 DST 到 TSMC,并且回顾了数十项关于创业及其影响因素的学术研究,最终,总结出了如下最引人注目的七个结果。 

大家也许可以把这份调查视作为是一个有趣的参考框架。我希望这篇文章能够帮助创始人增强对自我的理解,并帮助周围的人能够加强对企业家这个非常特殊的群体的理解。 

下面是我的翻译简写,希望对大家有启发。


是什么造就了企业家?7 个关键人格特征

一,年少时就是破坏者 

在论文《聪明与非法》中,学者罗斯.莱文与约纳.鲁宾斯坦调查了一个人在早期的能力与其破坏规则的行为是否会影响他成为企业家的可能性。 

在进入劳动力市场前的几年里,未来的企业家们通常会表现出更加高的智力倾向、更加强的自尊心,以及对自己决定未来的能力有更大的自信。 

他们也更有可能从事非法活动。 相比于打工的人,企业家 “年轻时强取豪夺 “的可能性要高出 2 倍,被警察阻止的可能性要高出近 40%。在有关 “非法活动指数 “的总体评分中——包括逃学、赌博、贩毒、入店行窃和破坏公物等行为——方面,企业家的得分要比打工的人高出 21%。 

而 2013 年的一项研究发现:这种混合特征在结合时最有效。也就是说,既 “聪明 “又 “非法 “的年轻人最可能成为企业家。 

当他们从一个打工的人过渡到企业家时,也最有可能看到收入的最大增长。这也许并不奇怪,PayPal 的六位联合创始人中有四位在高中时就制造了炸弹。 

二,多面手 

我们现在转向爱德华.拉泽尔在 2005 年的一篇论文《创业精神》。该文讨论了创业精神与能力相对平衡之间的关系。到底是专家们最有可能创办公司,还是多面手们更可能成为创始人?

拉泽尔的研究使用了斯坦福大学商学院的数据来评估。他还特别研究了专业职位的数量、在商学院上课的范围,以及各科目的学术表现,是否会影响一个人成为企业家的可能性。

 结果显示:那些经历过较多专业职务的人,更可能成为企业家。事实上,在担任少于 3 个职业角色的人中,只有 3% 成为了企业家,而在担任超过 16 个不同职位的人中,有近 30% 成为了企业家。 

有趣的是,在不同组织之间的调动降低了成为企业家的概率——最可能成为创始人的人,是在同一组织之内担任了多个角色的人。正如拉泽尔所解释的:”并不是说企业家就是那些坐不住的人”。 

未来的企业家也更有可能参加更广泛的商学院课程,并在不同领域的最佳与最差成绩之间的差异较小。 

拉泽尔解释了为什么会出现这样的情况:

 “一些生产过程非常复杂,需要许多技能才能产生产出。而另一些,则相对简单。随着世界变得复杂,成为一名企业家可能需要更多的技能。在农业社会,农民不需要太多商业技能就能经营小农场,并将产品推向市场。但现代公司的创始人是一个不同品种,他们不仅仅是合格的技术人员;他们还必须了解如何创建全球业务。” 

广义上讲,拉泽尔的发现与我的经历相关。我见过许多创始人似乎都表现出了不同寻常的知识广度与全面性。


 
三,市场误判了你 

在多元宇宙的某个地方,乔布斯从惠普员工退休,而扬.库姆则在 Twitter 里担任产品经理。但回归我们的现实,这两个人都被这些公司职位拒绝了并创建了苹果公司与 WhatsApp。 

迪帕克.黑德与贾斯汀·图林森撰写的《信息摩擦与创业》,评估了乔布斯与库姆等创始人的故事是如何实现的。研究人员认为,当一个人在更广泛的市场中得不到足够的补偿时,他们就会选择创业。 

这里的根本问题是:信息的不对称性。

打工的人根据“可观察的能力信号”来被评估。这方面,教育程度与职业经历都是雇主可以观察的信号。(但乔布斯与库姆都是辍学生,这可能不是巧合)。虽然这种信号是合理的,但最终都是有噪音的信号。雇主可能会根据这些标准误判候选人,然后对他们的补偿不足。

 2020 年的论文,还研究了一个人在青少年时期进行的能力测试结果。这篇论文将这些信息与他们随后的教育程度与就业状况联系了起来。

结果发现:那些成为企业家的人,往往在青春期能力测试中的表现,要比具有类似学历的雇员更好。本质上讲,继续创办自己公司的大学辍学生,可能比作为 W-2 工作的大学辍学生表现出了更加高的智力才能。 

如果雇主主要根据一个人的教育背景来判断,他们可能会低估其能力。正如研究报告所指出的:“一个人自己的能力,与具有相同学历的人的能力的中位数之间的差距越大,这个人就越有可能选择创业。” 

该研究也部分地解释了为什么移民经常会转向创业。 这些群体经常被低估。每一个风投领域的观察者都会观察到这种现象。最近,一家著名风投的 GP 分享说:其最后一个基金中 70% 的企业家是移民。而以前的研究表明,美国移民成为企业家的可能性几乎是其他人的两倍。

我当然不是乔布斯,但反思一下我自己的经历是很有意思的。在创办这份刊物前的几年里,我在几家顶级风投机构的面试中曾走得很远,但在最后一关落败。虽然可能有多种原因,但我觉得我非正统的专业背景(律师事务所、小说写作、烹饪学校、国际发展)导致了我被误判。

当然,我可以像在麦肯锡与谷歌轮换过两年的人一样分析公司的基本面(或者我能比他们做得更好;你好自我,我的老朋友?)但是单干,感觉是以某种方式测试我这种自信心的最清晰的机会。 


四,患有双相情感障碍、多动症与强迫症的人 

“没有一些疯狂的触觉,就没有伟大的天才。”据信亚里士多德曾这样说。2019 年的一项工作表明,对企业家来说这是真实的——无论是直接还是间接。 

企业家遭受心理健康问题的频率要高得多,而且,他们的家人患有这些疾病的比例往往更高。 

在接受研究的企业家中,49% 的人自称有一种或多种心理健康状况,而非企业家中只有 32%。 

如果考虑到家庭成员的因素,那么基本上有 72% 的创业者直接或间接受到了心理健康问题的影响。而非创业者的直接或间接影响率则为 48%。 

研究人员 Freeman 和 Staudenmaier 对企业家中患有双相情感障碍、多动症、抑郁症、焦虑症与药物滥用的普遍情况特别感兴趣。他们建议,那些高度拥有大量成功人格特征的企业家,也可能会有更多可被诊断的精神疾病。

我发现:围绕双相情感障碍与多动症的对话最让人抓狂——此外,还有一项专注于强迫症的补充研究。下面是几点具体的看法:……

本文剩余内容的主要摘要如下:

先说个小故事:昨日我知识星球的一位球友告诉我:TA 在读了两遍这篇文章后,研究了网上关于 ADHD 的资料,然后和家人认真讨论了一下,终于都认可了其患有 ADHD 的事实,目前准备开始治疗。

那么, 有关企业家们的秘密——这篇文章的其他三个研究结果分别是什么呢?

需要大家到我的星球阅读。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

为什么 ChatGPT 没有成为超级入口?

前些天有这样一条消息:5 月 29 日,OpenAI 创始人萨姆.奥特曼在接受人工智能公司 Humanloop 的 CEO 拉扎.哈比卜访谈时谈到了 OpenAI 的未来。

尽管第二天,Humanloop 应 OpenAI 要求迅速删除了这一分享。但根据其他网站的转载,我们依然可以追溯到奥特曼当时分享的几个核心要点。

其中,奥特曼提到了一个重要信息。如下:

“ChatGPT 不会很快发布后续插件,因为从实际市场情况看,插件目前没有达到产品与市场的契合度(Product/Marketing Fit)。除了浏览之外,插件的使用情况表明,他们还没有和市场达到最佳的契合点。”

换句话说:ChatGPT 并没有像很多人预期的那样因为插件而成为一个超级入口。

那么究竟是为什么呢?


(一)

5 月 29 日那天,我正好把自己关在家里,紧张兮兮地测试钉钉加入生成式 AI 后的能力。

5 月底,我成为了“钉钉斜杠‘/’”第一批邀请测试的企业用户,“钉钉斜杠‘/’”首批开放的能力还挺多,不光有熟悉的文档,还有群聊、应用开发以及会议等场景。

我的目标是:我要测试一下这几个场景的生成式 AI 能力,并将其与我所熟知的海外同类产品做一对比。

首先我发现,钉钉文档与 Notion 很像,都围绕办公内容生产的自动化设置了十几个场景。但两者的最大差异是:钉钉把“文生图”、“文生表格”的能力也一起放进了文档里。

这样做的最大好处是:在工作中,我们可以在一个界面,就完成写作、插图和表格的植入。这将大大提高职场人士生产内容的效率,也使钉钉成为了国内首个将文生图 AI 能力落地到应用中的生产力工具。

比如,Notion 就没有文生图功能。文字生成图片方面,海外做得最好的是 Midjourney。尽管钉钉文档生成的图像在画质优雅方面不如 Midjourney,但我觉得这不是大问题,因为钉钉强调的是办公场景,更加强调的是图像的功能性。反而,我觉得钉钉文生图两个最大的 Bug 是:

第一,因为众所周知的原因,钉钉无法生成敏感人物的图(如特朗普、范冰冰等);第二,钉钉无法很好地生成涉及名人的图。根据钉钉告诉我的说法:这个问题与版权有关,因为名人图像非常容易被恶搞之后四处传播,在法律上容易存在风险。

下面,是我用钉钉文档中“文生表格”功能生成的一张表格,我把它调成了我最喜欢的绿色。随后,我将用这张图来测试钉钉在生成应用方面的生成式 AI 能力。


(二)

在钉钉应用生成方面,我最喜欢的是一个傻瓜级功能,叫“识图搭应用”,它允许任何人通过拍照的方式来让钉钉识图,然后快速生成应用,非常适合我这种不会写代码的人。

如下图,当我把上述绿色的表格上传到“识图搭应用”里,机器人很快就把我制作的表格变成了一个应用,让我预览。

预览中,我发现表格的标题不完整,于是动手修改。这个时候,页面飞快地转到了钉钉在 2020 年推出的低代码应用平台——宜搭。

根据从钉钉了解到的信息:我用 AI 生成的这些应用,也可以打通钉钉、内部系统。如销售人员可以在群里实时提交当天的客户跟进记录,相关信息也可以通过宜搭接口同步到企业内部的 CRM 系统中,数据打通实现数据回流。

第二,钉钉已经把低代码的各类通用模板、常见小程序喂给大模型。因此,大模型里沉淀了千行百业(制造业、医疗、建筑等)以及各类高频业务场景(人事行政、财务报销、生产制造)中的上千个应用模板,构建了大量业务 Knowhow 数据,可以根据用户指令来智能推荐并补全业务应用信息。

另一个我觉得很有意思的 AI 功能,是钉钉群聊 IM 中的问答机器人。

这个机器人支持任何人和公司在投喂给它私有数据后,都可以定制一个专属于自己的 AI 对话机器人。如下图,我投喂给了机器人我的《加入知识星球必读》。

在快速学习了我的私有数据后,下面是我向机器人提取的信息:

这个机器人的胃口很大,可以一次学习数十万字的中文材料,然后,智能生成对话问答。每一位群成员都可以在群里 @它、向它提问。

从体验中可以想象到商业场景的可能性:这种 AI 场景将在社群运营、客服答疑、新人培训、公司制度及各种专业类内容(如法律等)时发挥重大作用,并大大帮助公司节省人力、提升分析问题和寻找答案的效率。

当然,钉钉也有群聊 AI 方面的其他功能。如在面对群内海量聊天记录时,能够一键自动生成聊天摘要、拿捏出重要信息。

此外,钉钉会议还可以实现无时长限制、无字数限制的摘要能力,一场两小时、一两万字的会议,钉钉会议会根据内容智能划分章节,最终根据信息整合类似的内容生成为几个大的议题摘要。

需要注意的是:5 月 4 日,Salesforce 也推出了人工智能工具 SlackGPT。和今年 3 月 Slack 推出的 ChatGPT 机器人作为一个集成添加到平台中不同,SlackGPT 是被嵌入到了 Slack 的核心功能里。

简单讲,SlackGPT 具有集成到应用本机界面的功能,以及用于自定义工作流程的无代码工具。用户可以一键点击迅速“总结”错过的内容。在大家的讨论场景下,SlackGPT 还可以根据音频记录生成智能摘要并将其放入聊天中。

但是截至目前,Slack 还没有推出 SlackGPT,高管说可能需要等到明年。也就是说,钉钉推出群聊 AI 的速度要比 Slack 快很多。


(三)

当然,Notion 和钉钉的最大差异其实是“第一逻辑”。

尽管两者在整体架构上很像,都可以用于经营公司、管理项目和捕捉想法,但 Notion 的第一逻辑首先是一个个人工具,然后才是公司逻辑;而钉钉则首先是公司逻辑,然后才是一个个人工具。也正因为此,我非常期待融合了 AI 属性的钉钉个人版的出现。

并且,我很自然地就由钉钉个人版的 “/”,联想到了伊隆.马斯克的 “X”。

因为同是 5 月 29 日消息:根据萨姆.奥特曼在接受人工智能公司 Humanloop 的 CEO 拉扎.哈比卜访谈时的说法:

“尽管许多开发者都表达了在 API 中融入 ChatGPT 插件的兴趣,但是插件可能不会很快发布:因为插件目前没有达到产品市场契合度(PMF),除了浏览之外,插件的使用情况表明他们还没有和市场达到最佳的契合点。

第二,很多人认为他们希望他们的应用程序在 ChatGPT 中,但他们真正想要的是在他们的应用程序中可以使用 ChatGPT。”

这里透露出的一个重要问题是:为什么目前 ChatGPT 的插件没有达到产品与市场的契合度?

我猜测可能的答案如下:

根据我查阅的 Chat.openai.com 在 Similarweb 的信息,如下图:

Chat.openai.com 在今年 3 月的总访问量(桌面和移动设备)达到了 18 亿次,平均每次访问的页数为 6.22,平均访问的持续时间为 8:32 分钟。

从上图中可以看到:平均访问的持续时间太短,可能是一个问题。

此外根据美媒的最新报道:为了对抗微软和 OpenAI,以及谷歌的 DeepMind 的合作伙伴关系,伊隆.马斯克正在 AI 领域准备一个新项目,这个新项目“某种程度上”可能涉及利用马斯克的至少两家公司——特斯拉和推特——的技术。

马斯克的原话是:“我认为这场比赛中,应该有重要的第三匹马。”

马斯克近日对美媒表示,他不想在公告上仓促行事,“但 OpenAI 与微软的关系似乎运作良好……所以 X.AI、推特和特斯拉,可能会有类似的东西。”

上个月,马斯克将 X.AI Corp. 注册为 AI 的初创公司,并将 Twitter Inc. 并入了 XCorp.。根据马斯克的说法,他对 Twitter 的抱负之一是将其转变为“一切应用程序”,也就是它戏称的 “X”。

而叶军也曾在 4 月 18 日的媒体专访会上提到了一个很有意思的观点,如下:

“未来不需要那么多 App 了,用户端有一个超级 App 就可以了。然后,这个超级 App 去跟周边包括打车软件、订房软件全集成到一起。这是一种新形态,以前都是链接、跳来跳去,但未来的智能时代不会有跳转,不会有界面,也不会有 App。”

“我个人的判断是:未来是一个从 Low Code 到 No APP 的过程,而智能入口就是核心的入口,操作极简,把底层数据都打通。这个过程一旦完成,格局将发生非常大的变化。所以从今年开始,钉钉的功能也会变得越来越简洁。我认为未来钉钉个人版的 AI 助手,会是就嵌入到各种场景里的自然语言的表达,这种形式将成为终极的形式。”

因此,我也非常期待钉钉 AI 个人版的发布。并且我想提出的一个重要问题是:

如果 ChatGPT 的用户平均访问的持续时间太短是一个问题,那么一个本身就有极强用户粘性的超级 App——可能是如 Twitter 这样的 IM(即时通讯)或是如钉钉这样的办公 IM——是否可能塑造未来 AI 的终极形式呢?


说明:因为各种各样的原因,我在微信公号写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

商汤科技的 OpenAI 野心

人间一日,大模型十年。这两天美国 LLM 行业的最新议题是:AI 功能的运营成本如此之高,包括微软在内的已经推出 AI 功能的软件公司究竟该如何定价、又如何说服客户买单?

根据美媒的最新报道:

微软至少已经有 100 家最大的客户在购买席位多达 1000 个的生产力 AI 应用 Microsoft 365 Copilot 时,相比没有 AI 功能的经典版 Microsoft Office 365,多付了 40% 的钱,达到了一年 10 万美金的高价。

换句话说,在 AI 大模型的应用端,大客户价格已经飙升了 40%。

与此同时在基础设施端,几乎在同一时间,OpenAI 与商汤科技都向外界传达了一个信号——要把 AI 大模型的 API 价格给打下来。

5 月 29 日萨姆.奥特曼称:今年 OpenAI 的目标是要继续降低 API 的成本,首要任务就是更便宜、更快的 GPT-4。

而商汤科技联合创始人、大装置事业群总裁杨帆,则在近日接受我采访时和我重点强调了商汤大装置 SenseCore 的核心定位——提供人工智能基础设施的层,把人工智能的使用门槛和使用成本打下来。

由此引发的一个重要问题是:

在 AI 2.0/大模型时代奔涌而来之际,生产范式已经发生根本性的改变。商汤科技作为“中国 AI 第一股”,将如何抓住这个人工智能由量变引发质变的时代机遇,又将如何向资本市场重新讲述“新故事”呢?

商汤科技联合创始人、大装置事业群总裁杨帆

(一)

令人意想不到的是,杨帆在接受我采访时指出:

大模型并没有带来商汤科技的新故事。恰恰相反,大模型只是印证了商汤科技在 2019 年时所做出的一个判断。

在此之前,杨帆和我提到了一个重要的观点。他认为,从商汤科技作为一家 AI 原生公司的视角看:

所谓的“大算力+大模型”,其实是随着数据量和算力达到一定数量级之后,一些量变引发了质变,从而突破了一些人的传统认知,认为这个东西和以前有很大的不同。但从技术的角度看,没有根本性改变,更多是一个持续性发展的过程和结果,因为当模型足够大了之后,可以把很多复杂的问题泛化为一个通用问题。

比如在自动驾驶领域,未来路上常见的、具体的 99% 以上的物体,都可以用一个模型来解决,从而加速整个自动驾驶技术的发展。再比如此前智能音箱的人机对话,过去需要一些标准句式,否则体验感不好,但通过 LLM,只要是用户正常日常交流中会出现的语句语式,它就基本不会出错。

“因此,大模型带来的不光是效率的提升,而是让原本一些体验不够好而无法形成大规模应用的场景,到今天可以形成大规模的应用。”杨帆指出。

随后,杨帆和我分享了在商汤科技内部发生的一些故事。

杨帆表示:自 2014 年商汤科技成立,杨帆就一直在公司各业务部门做轮转。2017-2018 年时,他发现了市场上的一个巨大痛点:

作为一个纯 AI 技术公司,彼时,商汤在做产业落地时必须把全环节都做了,甚至连客户的安装实施,都需要由商汤来提供一份详细的实施指导手册。

如在安装智慧化摄像头时,扭完螺丝之后需要做一些角度的调教和简单的测试,但供应商们并没有这个概念,就会导致安装出现问题。这也大大延宕了整个人工智能在各行业做渗透和应用的速度。

“这个时候我发现,如果真要把 AI 在一个场景落实好,其实需要公司既懂 AI,又懂场景,但这太难了。”杨帆说:“而让商汤员工自己做又不现实,因为他们都是高科技研发人才,这样做人力成本高、性价比太低。”

到了 2018-2019 年,趋势开始发生变化:随着人工智能产业的发展,出现了一波小的 AI 公司。

他们的 AI 原生技术不强,但在理解某一个具体产业的场景时,非常强。这些公司的创始人通常学历很高,技术也很厉害,但很多并非 AI 出身,而是具有某一行业的背景和经历,能够拿到行业的某些资源来做行业的智慧化落地。不过,尽管他们能更好地理解客户想要什么,但在技术解决能力方面,也会有较为明显的劣势。

经过这两个阶段,商汤科技内部已经形成了一个判断,那就是:由于人工智能是一个足够通用的技术,从长期看,产业最后一定会分层。

具体而言:底下的一层,将会有人去提供基础设施核心能力,以把使用人工智能的门槛和成本给打下来。

而经由底下一层支撑起来的上面那一层,则会是一个百花齐放的应用生态层。在这一层里,做应用的人不一定会强调 AI,但他们理解应用,可以把整个信息化、智能化的技术体系拿来拼在一起去解决客户的问题。

2022 年底,大模型 ChatGPT 横空出世,这更加印证了商汤的上述判断。

“因为大模型的一次性研发投入非常大,风险很大,很可能搞了几年之后发现别人做得比你好,导致自己的模型没人用了。”杨帆指出。

“但反过来讲,如果你能把大模型做得足够好,把其变成一个 API 提供给上面使用的人时,你就可以把 API 的成本降到足够低。我们相信人工智能技术将来一定会渗透进所有行业,而且一个大的市场最后可能不会超过 3-5 家的体量,我们希望成为大模型时代中基础设施能力的供应者。”杨帆说。

需要注意的是:2021 年,商汤科技成功登录港交所,并同时提出了“一平台四支柱”的公司战略。实际上这个战略背后,就是商汤科技在 2019 年时所形成的上述判断。

所谓的“一平台四支柱”是指:

商汤科技的核心,还是要去做人工智能的基础底座,因为商汤科技有全体系链的优势,能够服务更多的人,让 AI 技术以更低的成本、更低的门槛、更高效率地进入到各个场景里。

此外,商汤科技也会不断去做一些大的产业赛道,包括智慧城市、智能汽车等等。但商汤科技也有边界,不会吞吃所有产业,而会选择把更多的场景,通过自身基础设施的能力去开放出来。

也就是说,商汤科技在 2021 年时提出来的“一平台四支柱”中的一平台,就是指在商汤自身理念不断发展的大背景下应运而生的商汤大装置 SenseCore。

需要注意的是:早在 2019 年时,商汤科技就已经推出了 10 亿参数量规模的视觉模型。彼时,商汤科技使用了上千张 GPU 卡进行单任务训练。并在过去两年里,还训练了百亿参数规模的超大视觉模型。此后的今年 3 月,商汤科技又推出并开源了多模态多任务通用大模型书生(INTERN)2.5,具有 30 亿参数。

紧接着 6 月 7 日高考开考,商汤科技联合上海 AI 实验室、香港中文大学、复旦大学及上海交通大学发布了千亿级参数大语言模型“书生·浦语”(InternLM)。

“书生·浦语”具有 1040 亿参数,是在包含 1.6 万亿 token 的多语种高质量数据集上训练而成。

上述联合团队选取了 20 多项评测对“书生·浦语”进行检验,其中包含有全球最具影响力的四个综合性考试评测集:

  • 由伯克利加州大学等高校构建的多任务考试评测集 MMLU;
  • 微软研究院推出的学科考试评测集 AGIEval(含中国高考、司法考试及美国 SAT、LSAT、GRE 和 GMAT 等);
  • 由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集 C-Eval;
  • 由复旦大学研究团队构建的高考题目评测集 Gaokao;

随后,联合团队对“书生·浦语”、GLM-130B、LLaMA-65B、ChatGPT 和 GPT-4 进行了全面的测试,针对上述四个评测集的成绩对比如下图(满分 100 分):

测评结果显示:“书生·浦语”不仅已经显著超越 GLM-130B 和 LLaMA-65B 等学术开源模型,还在 AGIEval、C-Eval 以及 Gaokao 等多个综合性考试中领先于 ChatGPT;在以美国考试为主的 MMLU 上实现与 ChatGPT 持平。

而训练上述模型的基础,包括商汤在今年 4 月推出的大模型体系“日日新”,均得益于商汤大装置 SenseCore 的支撑。

根据商汤科技和我透露的数据:商汤大装置 SenseCore 共有 27000 块的 GPU 芯片卡,可以输出 5.0 exaFLOPS 的总算力,是目前亚洲最大的智能计算平台之一,站到了与 BAT 同台竞争的位置上。

但这也给商汤科技带来了巨大的成本支出。

根据商汤科技的财报:2018 年—2022 年间,其研发费用率从 45.9% 飙升到了 105%。

不过,砸下去的天文数字也变成了商汤在这一轮国内 AI 大模型竞争中的“算力优势”。

“目前行业里普遍认为,算力就是基础设施。但实际上,人工智能的基础设施是指算力、数据、算法(包括基础算法和算法相关的工具)三位一体的东西。”杨帆指出。

也就是说:当我们提到算力之争时,这里的算力,其实不仅仅是指硬件的资源,还包括上面一整套的基础软件体系;数据,也不仅是指数据本身的积累,还包括处理数据的能力、整合数据的能力、使用数据的 know-how 等等。

而谁如果能把这三者的整合能力提供好,能够提供更低的成本、更低的门槛,将决定整场竞争的成败。

而这也正是商汤大装置 SenseCore 的核心使命。


(二)

杨帆还和我指出了商汤科技相较于国内外同类 LLM 公司所具有的差异化优势,在如下三个方面:

第一个是,商汤科技提供端到端的产品应用解决方案的能力。

这里一方面,商汤科技可以建设外部的应用生态,另一方面,商汤科技内部有大量的应用场景,可以快速去做闭环落地,这对于基础设施早期拼增长、抓客户的时候具有优势。

因为这样的过程,是商汤科技一个很强的窗口期。在这个阶段,商汤过去强于其他任何公司的端到端价值验证的能力会起到重要的作用。

“因为不管在任何场景下,人工智能还是一个很新的技术。第一,它在快速迭代;第二,它很不成熟。这会导致很多客户对 AI 的 一些基本概念、认知、价值、边界和局限性都没有很好的理解,甚至完全没有概念。要么过于乐观,要么过于悲观。所以最后就会发现,当 AI 真正要做产业落地时,大家必须要拿端到端的价值来说话。”杨帆指出。

因为说到底,客户其实很难辨识基础设施本身的厉害与否。一家厂商的定位如果就是提供基础设施,它其实很难自证价值。也正因为此,给客户提供完整的价值闭环就非常重要。

“也因此,AI 不是在最开始就提供基础三大件,而是一上来可能就要有行业解决方案包。另一个,也看到很多人会花很大代价去建整个应用生态。”杨帆说。

而第二个优势,就是商汤本是一家 AI 原生公司,这决定了从公司成立第一天起,商汤科技就在做 AI 大装置的基础设施。

这非常不同。举一个例子。

同样去讲一个 AI 的大装置,它底下可能也有数据中心,但传统建数据中心建互联网机房时,首先最重要的是带宽。而今天去建一个智能化的计算中心,首先是硬件服务器的配置。包括配什么类型的训练,配什么类型的推理,训练和推理之间是什么关系,以及集群内部的网络调度是什么等等。因为其使用模式、使用的 Python,可能就是重计算、轻用户之间的带宽交互。所以用户和使用场景不同,会导致从下到上整个技术的体系都跟原来不一样。

而在这方面,第一,商汤没有历史包袱。第二,商汤内部,其实早已经沉淀了大量的专家认知和工具:从芯片、服务器、基础软件、工具软件、算法生产到应用,对 AI 的各环节都能够更加理解,中间每一环节的问题挑战、困难在哪里,都非常清楚。

“我们今天要做的,其实无非就是把这些东西标准化成为一个产品和服务向外提供出来。”杨帆指出:“我认为这也是我们的一个核心优势,因为我们就是做这件事起家的,所以对每个环节的困难、挑战都更懂,积累的经验也更多。”

第三个优势,就是开源生态的建设。

根据杨帆的理解,大厂的开源生态其实做得并不好,原因是大厂搞生态核心搞的都是框架的生态,但从互联网 IT 行业到 AI 行业实际上已经发生了一个很大的变化。

“在互联网时,工具是核心的价值提供,所以大家都去做工具的开源,做工具的开源是互联网时代形成生态最重要的方面,而框架也是一种工具。但在 AI 时代,其实最重要的已经不是框架了,而是算法和模型,这就是为什么国外Hugging Face做得好的原因。”杨帆说。

需要注意的是:从 2017 年开始,商汤科技就没有开源过任何一个框架,其最核心开源的是一个算法仓库——海量算法 OpenMMLab。而这个算法目前在 Github 上达到的 Star 数比 Pytorch 还要高。

“在 AI 年代,真正的高价值蕴含都在模型里,你所谓的开源建设一个有效的生态,只有把核心价值的属性板块开源出去,才会更容易形成你的生态。”杨帆说。


(三)

当谈到如何与资本更雄厚、资源更多的大厂竞争,比如,如何应对大厂们可能会利用一些低价行为来打市场的策略时,杨帆提供了下面的观点:

“其实基础设施都类似,最后拼的最重要优势一定是成本。但是这个成本,一定要关注它最后所谓的用户成本。“杨帆指出。

也就是说,用户想干一件事,最后他关注的其实是:我到底花了多少钱可以训练出一个 1,700 亿的、能达到某个指标的大语言模型。

“而在此过程中,其实不只是单独地给算力,因为算力今天以服务器计价。实际上当你软件做得足够好的时候,实际上就意味着别人要用 10 台服务器干的事,在商汤这里可能通过软件的优化之后,用 6 台服务器就做了。那么即便你的单价高,最后对用户来说,算总账时仍然划算。或者说,我们这里还有一些数据的储备,数据服务,一些工具化服务,我们把这些所有的服务加在一起,最后用户要达到他的目的,需要什么样的成本付出,最后大家比拼的其实是一个端到端综合成本的控制能力。”杨帆指出。

根据杨帆的观点,因为目前人工智能的智能计算市场还处于一个非常早期的阶段,但这也正是商汤科技的机会所在。

这里的逻辑是:通常,市场早期的技术发展还在快速迭代阶段,而当技术还不成熟时,如果你能在技术上领先,那么你其实有各种各样的方式来通过不同的渠道去综合优化成本。

而相比较,当一个市场技术已经进入相对的成熟期后,竞争将只能靠规模、靠一些供应链来压价和降低成本。

类似的一个案例是在公有云领域。

如国内公有云的发展比国外晚了 7-8 年,但今天国内的智能云则基本上与国外同步。这里存在着一个映射是,国内的公有云市场即便是早期阶段,但从技术的角度讲,它很多的技术已经相对成熟,已经过了依靠技术能力去快速获得一些成本优势的阶段。而如果回顾云服务市场的早期,甚至很多行业处于早期发展阶段的时候,技术优势都将在成本方面带来最终的很大价值。


说明:因为各种各样的原因,我在微信公号写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码:

“我是一名急诊科医生,我这样用 ChatGPT 来帮助患者”

比尔.盖茨最近和美媒指出:未来几年内,健康和教育是最可能被人工智能“彻底改变”的诸多领域中的两个例外。

和大家分享一篇我很喜欢的来自 Fast Company 的文章。作者乔什·塔马约-萨弗博士在美国的一个社区急诊科从事临床工作,他也是美国健康科技创新孵化器 Inflect Health 的创新副主席。

以下是我的翻译简写,希望能给大家带来启发。


I’m an ER doctor. Here’s how I’m already using ChatGPT to help treat patients

随着人们对 ChatGPT 和其他大语言模型程序的爆炸性兴趣,许多人工智能传道者正在吹捧 AI 作为医疗诊断工具的用途——甚至广泛地宣称 AI 是医学的未来。

但就像许多高科技创新一样,这样的宣扬,往往会掩盖掉那些我们其实可以马上就能将其应用到现实生活中的“小而关键”的应用。

我说这个话,是作为一名正在使用 ChatGPT 来帮助治疗患者的在职急诊科医生说的。

但我不是将 ChatGPT 用于诊断。作为诊断助手,ChatGPT 的效果相当好,但这需要前提——你需要给它提供完美的信息,而且病人已经有典型表现——但现实生活中这种情况很少,并且必须是在你不介意 50% 的成功率经常会错过危及生命的情况下。

最近的一次夜班中,我在凌晨 3 点左右,看到了 ChatGPT 在医学上更加直接的效用。当时,我在治疗一位 96 岁的老年痴呆症患者,由于她的肺部有液体,所以她呼吸困难。她的三个孩子(都是 70 多岁的老人)也在急诊室里,这更增加了挑战。

可以理解的是:他们围着我和我的工作人员转来转去,以至于他们不断提出的要求实际上延缓了治疗。而让问题更复杂的是,他们绝对地确定他们的母亲需要什么。

“护士,我们的母亲需要静脉输液来治疗她的脱水症。请快点!”他们三个人都向我们重复这个请求,整整持续了一个多小时。

需要注意的是:实际上,静脉输液会使她的情况更糟,甚至会导致她死亡。

“我知道你们很关心你们的妈妈,”我试着向他们解释:“但她现在不能呼吸,因为她有肺水肿,也就是肺部有液体。如果我用静脉输液给她补充水分,会使她的肺水肿恶化,她可能会死。一旦我们把她肺里的液体排出来,呼吸问题解决了,我们就可以担心她的脱水问题了。”我说。

但病人的儿子们坚持说,而且很坚定:“但凡她生病,就是因为脱水而需要输液。你为什么不直接给她输液呢?她马上就会好起来的。”

我试图用多种不同的方式重新解释,但从儿子们面无表情的情况看,这些话都没有引起他们的共鸣。这其实是急诊室里的一种常见情况,人们在清醒时没有计划好在夜深人静时把患者带到我这里来的这种紧急情况,而且,他们的情绪往往处于失衡中。

更糟的是,其他几个病人更需要我的关注。

我急于寻找解决办法,就走到大厅的电脑前启动 ChatGPT-4,输入了下面这样一段话:

“请解释一下,为什么你不会给一个有严重肺水肿和呼吸困难的人进行静脉输液,尽管你可能担心病人脱水了。请用简单而富有同情心的语言来解释,让关心母亲的糊涂人能够理解。”

几秒钟内,ChatGPT 就制作了下面这段话:

“我真的理解你对你母亲的关心,对她的健康感到担忧是很自然的。

在严重的肺水肿和呼吸窘迫的情况下,给予静脉输液似乎有助于补充水分,但实际上可能使她的病情恶化。

当某人患有肺水肿时,他们的肺部充满了多余的液体,这使呼吸困难。如果给您母亲静脉输液,有可能会增加她肺部的液体,使她更难以呼吸,会造成她更多的不适。

我们的首要目标是确保您母亲的舒适和健康。医疗团队致力于为她提供最好的护理,他们将密切监测她的水化水平,同时采用更适合她具体病情的其他治疗方法。

请知道,你母亲的健康和舒适是我们的首要任务,在这个困难时期,我们会支持你们。如果你有任何问题或担忧,请不要犹豫,与医疗团队联系。

我们都在一起,我们会尽一切努力帮助你母亲康复。”

我把这个答复打印了出来,并向患者家人们宣读。当我背诵 ChatGPT 的话时,他们激动的表情立即融化为平静的同意。

更妙的是,我把打印副本交给了护士。当病人在等待重症监护室的床位时,家属们经常会回到护士身边询问静脉输液的情况(有些成员可能正与记忆障碍作斗争),而护士会向他们宣读剧本。这种方式总是受到热烈的欢迎。

同样关键的是,家属们会因此悄悄地退到一边,让我的工作人员专注于他们的工作。这样,我就可以把时间用在其他病得更重的病人身上,并在夜班的剩余时间处理好混乱的局面。

自从这件事发生后,我就开始使用 ChatGPT 来帮助以富有同情心的方式向病人和他们的亲人解释具体的医疗情况。在我的急诊室病房太忙或是人手不足的情况下,这已经成为一种宝贵的资源,可以准确又容易理解地解释复杂的医疗诊断。

在这样做的过程中,我逐渐意识到:

与 ChatGPT 打交道,就像是与一个令人难以置信的杰出的、努力工作的——偶尔会宿醉的——内部人员合作。这已经成为我考虑 ChatGPT 有用性的心理模型。

现在,对于任何潜在应用,我都会想:“一个专心致志但偶尔宿醉的实习生会不会让我和我的员工更轻松,或者管理他们的工作最终会不会比没有他们参与的情况下更费劲?”

从这个角度看,ChatGPT 或者一个宿醉的实习生仍然可以。比如说:

  • 记下我病人的病史
  • 为病人和工作人员创造长篇的书面交流
  • 用富有同理心和同情心的方式向病人解释高度技术性的信息

在每一种情况下,宿醉的实习生/ChatGPT 的输出,在使用前都需要仔细检查。但审查现有工作通常比从头开始要快得多。至于我真正的人类实习生,ChatGPT 就可以让他们解放出来,专注于最需要的活动:照顾病人。

作为扩大人工智能在医疗保健领域应用的倡导者,我希望该行业能专注于像这样立即就可以实现的应用,而不是人工智能会完全改变医学的长期前景。

因为许多或大多数这些未来主义的方案都忽略了实施的实际挑战。

仅仅满足于有关病人隐私的 HIPAA 规则就可能需要很多年,甚至是几十年的时间来解决,我们甚至可以考虑在医疗剧院直接使用 ChatGPT 这样的程序。 

然而,有关 ChatGPT 的间接使用通常现在就可以实施,而且实际上是迫切需要实施的——特别是在医生的职业倦怠水平已经达到历史最高点的情况下。

我们已经被仅分配给每个病人的几分钟时间所限制住,我们需要能够扩展和丰富医患关系的解决方案。

甚至,这些限制直接导致了一种常见的抱怨叫“医生讲话”——医生对症状和诊断的高度技术性的解释使病人们不知所措,甚至困惑,而不是让病人们感到被关心。很多时候,医生和他们的工作人员自己也不堪重负,无法用耐心、同情心和通俗的语言来解释医疗情况。

根据 CDC 的数据:美国各地的急诊室每年接待超过 1.31 亿人次。为了论证,假设使用 ChatGPT 来消除“医生讲话”的现象可以在全国急诊室中得到推广,并且每个病人平均可以节省 5 分钟,那么这将转化为每年节省超过 1000 万小时的时间——医生和他们的员工,可以将这些时间用于对更多病人的亲身护理。

但这些方法仍然在工作流程上存在挑战。如目前,输入 ChatGPT 的任何内容基本上都被发布到了网上;但为符合 HIPAA 的要求,任何能与特定病人联系起来的因素都必须被删除或改变。

(注:HIPAA 是一项联邦法律,要求制定国家标准以保护敏感的患者健康信息不被泄露)

此外,在采集病史的情况下,需要开发对 ChatGPT 与病人直接互动的系统,以确保宿醉的内部因素不会开始产生灾难性的建议。但这些都不是不可克服的挑战,而且回报是真实的。

我有点不好意思地承认:从 ChatGPT 的建议答复中,我学会了如何更好地向病人解释事情。但我也非常感激,因为我从病人那里感受到了更多的人际关系,他们明白我在为他们做什么,以及为什么这么做。

现在,有很多关于 ChatGPT 和其他 LLM 因其庞大的知识库而夺走医生们工作的炒作。它们其实不会的,事实上一个奇怪的讽刺是:由于人工智能的存在,我和我的急诊室工作人员都能够将更多时间投入到医疗保健的人类方程式(human equation)上。


说明:因为各种各样的原因,我在官网写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)

老星球用户续费请用这个二维码: