当前位置：首页 > 创业圈 > 商学 > 商业模式 > 正文

第四范式戴文渊：最适合大模型的商业模式是什么

来源：企业观察报　发布时间： 2023-05-17 11:59:58　编辑：夕歌

导读：第四范式创始人、CEO戴文渊称上市绝不是公司的目标和终点。“我希望未来，提起戴文渊大家都不知道他是谁，但提到第四范式，所有人都知道这家公司，而创始人是谁则要再查一查。”

从2015年到2021年，第四范式获得了多家知名基金及国有银行的多轮融资，并从2021年8月开始，三次递交招股书，但至今还没有上市。

据IPO早知道报道，第四范式于2023年4月24日更新招股书，继续推进港交所主板上市进程。

在4月25日接受采访时，第四范式创始人、CEO戴文渊称上市绝不是公司的目标和终点。“我希望未来，提起戴文渊大家都不知道他是谁，但提到第四范式，所有人都知道这家公司，而创始人是谁则要再查一查。”

以下为戴文渊的采访整理，有删节。

ChatGPT带来的

不是技术突变，

是信心增强

ChatGPT的出现，对我们来说既是一个意外，也没有完全出乎意料。

大概在三四年前，即GPT-3出现时，我们就已经有了预期，只要达到一个临界点，大模型将会到达一个举足轻重的位置，但彼时我们很难预见它抵达临界点的具体时间。因此当它在今年实现爆发时，对我们来说确实很意外。

其中，ChatGPT的出圈对于整个产业是一个特别大的推动。技术的进步可能是线性的运动，但信心则是跳变的，当技术没有过临界点时，公众的信心可能趋近于0。

因此，在我看来，这一波风暴主要来源是信心的变化，技术上并没有特别大的突变。

例如AI绘画等相关应用，其实在去年甚至几年前就有了，如果在去年，大家对让人工智能替人画画，可能没有太多兴趣。但在今年，即便我们不主动提及，大家也可能追着问，想了解AI画画。

第四范式现在有一个100多人组成的研究院团队，相当于我们公司的“达摩院”。毫无疑问，大模型是我们绝不能错过的一个方向。

大概在2018年，Google推出BERT（模型）时期，我们已经开始做相关工作，虽然彼时BERT还有一定的局限性，但到了GPT-3之后，大家已经基本上看清楚技术路线的发展方向了。在这个过程中，我们一直有投入，但和今年相比肯定有差异，尤其在（技术的）临界点突破后，大家的精气神和信心都完全不同了。我们现在每天晚上都在加班加点工作，而且每天都可能有新的同事加入进来。

信心一直是困扰我们的问题。去年同一时间，如果我们推出“式说”1.0和2.0版本，应该不会有很好的市场接受度。这也导致，尽管我们在大模型层面已经有了很长时间的储备，但重视程度一直不够。

临界点过了之后，我们的第一反应就是赶紧把家里的东西拿出来产品化。于是我们在2月和3月分别推出了“式说”1.0、2.0版本，其实现在我们有好多能力还没有加到产品里面，还在逐步地往里面加。我们今天采访后，一两天时间，我们的研发团队又要拿出新的版本去做测试。我们现在每天都在加班。

在这过程中，我们遇到最多的问题就是“可控”。即什么样的事是可控的，什么样的事是不可控的，或者说客户能接受的可控与不可控的范围，都需要我们去打磨。例如用户要求AI实现某个功能，即使准确率是99%，这个也不能用，要实现100%。或者起码要做到，当告诉（AI）“你错了”，它有办法迭代更改，即“知错能改”。

并且我们也在对产品快速迭代，相当于我们今天采访结束后，只需要一两天，我们的幕后研发团队又能拿出新的版本去做测试。对于大模型的能力涌现，我们并不会表现得非常激动或敏感，在我们看来是自然而然甚至习以为常的事情，我们对于自己的大模型的能力评价就是“应该的”。

因此，我们在这波大模型的投入上没有一个明确上限，只要是我们的现金流可以接受的范围内，我们就会加大投入。对于最终产出的模型或产品，目前最高能提供到千亿（参数）规模。

大模型最先改变的

是to B领域

现在外界把AI分成1.0、2.0，我理解过去的AI，是点上的AI，大家可能在它达到1亿或10亿参数的时候，就可以接受了。现在大家讨论的AGI，是面上的AI，它的模型需要到一定的量级以上，才能够显现出我们可以接受的能力或水平。比如100亿规模参数以下的大语言模型，它的能力基本上不会被接受。

所以过去我们寻找的AI落地场景，如搜索引擎、资讯推荐、金融交易等，都要满足价值够大的条件。因为在过去，构建一个模型，只能在这一个点（场景）应用，比如搜索引擎只能搜索，现在，多模态大模型能力可以成为底座，上面接多个场景。这就意味着，在过去模型研发要参考投入产出比，这次大模型热潮的出现，是一次完全的升级换代。

过去的点上的AI是没有办法脱离软件独立存在的，如抖音的推荐算法不能直接给到用户，而是要放到APP里。

这也是我们现在看到的最大机会：AI有可能把整个软件产业再升级换代一次，包括to C和to B两个领域的软件。

而在大模型的落地应用层面，我一直以来的观点是，它最先改变的是to B行业。因为B端企业软件的起点较低，可改造空间更大。比如二维码支付在中国最先普及，但到了美国却没那么容易普及，因为美国的信用卡业务做得太好了，到处都可以刷卡。同理，中国的to C软件过去十几年已经被打磨到了比较高的水准，用对话框未必就一定更好用。

反观，B端企业软件面向功能导向、交互门槛更高。而AI大模型带来的新的（对话框式）交互模式，不仅有机会创造出一个交互极简、功能强大、自我迭代的新型软件工作流，提升B端软件的使用体验，而且在开发层面，之前B端企业软件都是基于菜单式的开发，每次一个功能升级至少是月级别的开发时间，现在AI改写数据和API的效率比原来高得多，在这种新的方式下，软件迭代的效率提速到以天为单位。

无论是用户体验，还是开发者体验，都得到了飞跃式提升。

市场的反馈对我们也有很大的推动作用，ChatGPT出现后，客户对AI的包容度和信心相应提升。我们也在跟我们的客户同步推动技术产品的落地，如金融、能源、运营商、零售、医疗等行业。另一方面，技术的快速滚动也加速了我们新增客户的效率，我们现在每天都会有新客户进来。

相比于过去软件领域的盈利方式，我认为最合适（大模型）的商业模式是算力，AI的算力是不可被忽视的领域，如每一次去访问ChatGPT都消耗了几毛钱的算力，我觉得目前这是非常合理的计算方式。

至于to C领域，我们暂时还没有一个明确的商业计划。但在这方面，我们也是持open的态度。

一家快速迭代的to B公司

我觉得很有意思的一点是，最近几个月，我们这家to B（科技）公司的工作模式，越来越像一家互联网公司。

过去，我在互联网公司工作时，大家追求的都是快速迭代，每天都会不停地产出新的东西，然后做实验去试，再根据结果的好坏不停地迭代。

虽然第四范式是高科技公司，但我们本质是一家做to B业务的公司，因此过去我们的迭代以及反馈周期，和原来的to B公司是一样的。甚至我们每年更新两个大版本，在to B的软件企业里面已经算迭代得特别快的。

过去我们根本不敢想象每个月迭代一次，甚至每天迭代一次，但在ChatGPT的交互形态下，我们现在从产品到技术研发等各个阶段，都被改变了。

此前我们研究部门做出的算法，可能要经过工程化、产品化再到解决方案，然后才能推向市场。整个环节可能需要少则一年，多则2～3年。但现在，AI让我们研究团队做出来的东西，可能在一两天后就能进入到产品阶段。不仅仅是我们，整个世界都是这样，GPT-3.5进化到GPT-4也很快。

我觉得对于团队来说，这种感觉也非常不一样，以前我们100多人的研究院团队，外界可能不太需要知道他们的存在，因为研究的内容在至少一年内都不会产生商业价值，也不会推向市场实现商业化。在这一年的时间里面，我们只能自己给自己一个积极的反馈与信念。

但现在整个形势变化后，只要新的东西一出现，立刻就可以被大家看到，或者对产业产生影响。我们其实非常enjoy这种方式，因为我们都是互联网公司出来的。现在我们公司的运转非常像互联网公司模式，以前互联网公司都是不断迭代、不断试错的一种形态，迭代试错会让产品能力越来越强。我们现在也是如此，我们不会完全将产品打磨成熟，而是将α版或β版给到客户，我们一起打磨，因为客户内部也在每天迭代、改进。

最近，我个人的工作状态可以称之为“夜以继日”，几乎所有的时间都在工作。这主要是“腾讯会议”带来的。以前安排会议，同事会问我，“你什么时候在公司？”现在他们问的都是：“你什么时候不坐飞机？”一旦连了卫星电话，可能以后坐飞机与否都不需要问了。

对于公司的未来发展愿景，我在刚创业的时候就和其他创始人聊过这个话题。我希望未来，提起戴文渊大家都不知道他是谁，但提到第四范式，所有人都知道这家公司，而创始人是谁则要再查一查。海外有很多公司创始人都“隐身”了，就像IBM，外界都不太记得创始人是谁了，包括微软现在也不太需要比尔·盖茨，但公司还在很厉害地继续往前走。创业公司可能很少有人能够走到这一步，我们希望有一天第四范式能走到这一步。所以这是我们创立第四范式的目标：不是为了让我成功，而是让这家公司成功。

标签：第四范式戴文渊大模型商业模式