Skip to main content

DeepSeek还会继续卡下去,这个画面很美妙

一、DeepSeek往事

Image 29: Image

1月20日 DeepSeek发布开源的推理模型R1,在各项benchmark指标上接近甚至超越地表最强模型OpenAI o1

1月21日 DeepSeek因为开源、来自中国、价格比OpenAI便宜90%以上等要素而在X上引发硅谷科学家、投资人热议

1月27日 DeepSeek app在中美两国AppStore登顶,最高时在全球165个国家AppStore霸榜;同一天,市场被吓傻,英伟达当日下跌16.97%,市值蒸发6000亿美元,约等于一个腾讯

Image 30: DeepSeek app sitting at number 1 overall in the US Iphone App Store is not…  | Nathan Lambert

1月28日 美国第二大AI独角兽Anthropic创始人Dario破防,建议美国加强芯片出口管控,意欲从头掐住中国AI发展的脖子

1月30日 仅上线18天的DeepSeek app日活突破1500万,而ChatGPT达到同样的数字则是花了244天

1月31日 OpenAI感受到危机,匆匆忙忙发布最新推理模型o3-mini,并将百万输出token的价格定为4.4美元,相比此前定价打了骨折

Image 31: Users Call Out OpenAI's Hypocrisy After DeepSeek Theft Allegation

2月04日 知名播客主Lex Fridman提出"DeepSeek时刻"概念,认为DeepSeek的发布是LLM时代的"AlphaGo时刻"

2月06日 我在B站发布的DeepSeek教程视频突破百万播放,最高11000+人同时在看(删掉)

2月12日 苹果官宣在中国区和阿里合作,而非DeepSeek(相比苹果官方语境的deepseek缺乏大规模项目经验而被剔除,我更相信是deepseek自己拒绝了合作邀请)

2月15日 你还是很难在5分钟内让DeepSeek为你回复两次,像个渣男

Image 32: Image

二、四问DeepSeek

所以,我们不禁要问:

1、都火到这地步了,春节也过完了,春节档上映的《哪吒2》都突破百亿票房了,DeepSeek你还来不及解决繁忙问题吗?

Image 33: 哪吒2對著美國貼臉開大了?DeepSeek出高招突破紀錄了【#新聞大白話】 20250209-6|#謝寒冰#栗正傑#介文汲

2、这大几千万,甚至上亿的用户你不想留下吗?要知道隔壁几家AI大模型六小虎和几家大厂可是为了那点用户在抖音、B站、小红书抢得死去活来了,抢到陈睿叔叔都乐开了花,引来了难得的财报红。

3、大家都知道大模型的边际成本不为0,所以,你很难持续为所有用户提供免费服务。但是,你就不能跟所有AI大模型公司一样,搞个会员制收点钱,为部分用户提供更稳定的服务,用这钱去向同在杭州的阿里云买点GPU服务器不香吗?

Image 34: Image

DeepSeek这波泼天富贵下,卡顿溢出的流量,让用户们认识了硅基流动、火山方舟、阿里云百炼、腾讯云,秘塔搜索、纳米搜索、腾讯元宝、ollama、CherryStudio、Chatbox等等。

更别提国外的Perplexity、Cursor、微软Azure、亚马逊云、英伟达也都早早或接入DeepSeek,或为开发者提供对应API服务的。

Image 35: Image

4、DeepSeek,你看到这些因为服务不稳定而流失的流量,难道不心痛吗?

三、AGI,是DeepSeek可能要放弃的最高代价

然后我突然意识到了,也许梁文锋和DeepSeek确实不为失去流量心痛,甚至他可能还乐见此情况的发生。

你或可以称之为开源精神,或称之为AGI信仰。

Image 36: Image

因为相比服务好几千万日活C端用户,相比先赚个几亿几十亿的,梁文锋应该是认为这个阶段更重要的事情是投入到他执着的技术理想,他的AGI信仰当中。

我们凡夫俗子可能会觉得这流量既然来了,不要白不要,你可以对此没有预期,但是既然老天爷赏饭吃,你没理由不接着,更何况,这可是个「国运级」的机遇。

但,一切皆有代价。经济学中的机会成本是也。如果他花时间去接这一波流量带来的收入以及可能由此形成的用户壁垒,这没什么不好的,比如隔壁Kimi每天不就在干这事么,Sam Altman和ClosedAI不也如此吗?

Image 37: OpenAI or ClosedAi? : r/DeepSeek

可,这会占据团队的注意力和时间,会拖慢研究的进展,放缓他们抵达AGI的时间。这便是DeepSeek如果要去承接这一波富贵,优先解决用户的繁忙问题所要承受的机会成本(最高代价)。

显然,权衡之下,梁文锋认为AGI是他更想做的事,他更想实现的目标。

移动互联网领域,此前有两个大佬让我感受到他们一以贯之的目标和决心。一个是黄铮,另一个是张一鸣。

所以,现在外界闹哄哄成这样了,你见梁文锋和DeepSeek团队的哪位出来发声了,那安静得就像他们全公司被绑架隔离了似的。

这个沉得住气的创始人和公司我真的喜欢。

四、AI的唯一流量密码是智能

我想梁文锋大概也是清醒地认识到,为什么DeepSeek能获得如此的所谓「泼天富贵」,他们可是什么营销都没干,这家公司连个市场部都没有。

凭什么DeepSeek的产品能获得如此的增长,答案好像不言自明:因为他们以极低的价格供给了最高等级的「智能」。

AI时代的游戏逻辑确实和移动互联网时代不同了,什么网络效应,不存在的,低价可得的更高级的智能才是AI时代的绝对门槛。

所以,他们疯狂地优化架构去找到最低的训练成本和推理成本,对智能对scaling law的极致追求也让他们愿意试错,发现了相比RLHF(基于人类反馈的强化学习)和SFT(监督微调),没有人类干预、没有语料天花板的RL(强化学习)才是Post Trainning的智能钥匙。

既然AI时代的竞争本质如此,那现阶段或多或少的C端用户量级和收入就确实没那么重要了。

Image 38: Image

你能因为智能的突破在20天内获得1亿用户,你自然也能因为其他团队取得对应的突破而失去他们。

要留下这一亿,两亿,三亿的用户,不是现阶段为他们提供更稳定的服务。而是真正为全人类提供负担得起的AGI,DeepSeek想得很本质。

我现在看到这繁忙的标志都不自觉地露出神秘的微笑。

梁文锋,我是你的破壁人。

在AI浪潮中,中国有这么一家理想主义的,以近乎疯狂的理念在创造创新的企业存在,还真挺让人放心的。

Image 39: Image

五、R1是懂梁文峰的

哦,对了,我还跟DeepSeek R1聊了聊这事,在没有联网的情况下,R1训练预料只截止到2023年底。他对梁文锋知之甚少,更是对DeepSeek 2024年以来的发展一无所知。

所以在投喂了「暗涌Waves」两次采访梁文锋的稿件,以及让DeepSeek推测了梁文峰的MBTI人格之后(顺便说一句,R1推测的是INTJ)。我问了R1下面这个预设性的问题,不愧是R1,它是真的懂梁文锋的。

太长不看版结论:即使面临“泼天富贵”,梁文锋的INTJ人格会将其工具化为AGI探索的加速器,而非目标本身。这种“反商业直觉”的冷静,正是理想主义技术领袖的典型特质。


我的问题:

我们假设下,如果他在推进AGI模型发展的过程中,如果有某个阶段的产品突然受到了大量的关注,20天内获得了超过5000万的用户,根据前面你的判断,他会怎么面对这个意料之外的情况,或者像是网友们所说的泼天富贵

R1的思考:

好的,用户现在问的问题是,如果梁文锋在推进AGI的过程中,某个阶段的产品突然在20天内获得了超过5000万用户,他会怎么应对这种情况,也就是所谓的“泼天的富贵”。首先,我需要回顾之前的分析,梁文锋的MBTI类型是INTJ,核心驱动力是探索未知和推动技术革命,注重原创性和开源生态。接下来,我需要根据他的性格特点来推测他在这种情况下可能的反应。

首先,用户可能想知道,作为一个INTJ,梁文锋会不会被突如其来的成功冲昏头脑,或者如何平衡理想与现实。用户可能想知道他是否会调整策略,比如转向商业化,或者坚持原来的技术路线。

此外,用户可能希望了解他如何处理外部压力,比如投资者的期望或用户的增长带来的运营挑战。 梁文锋之前提到过,他们的主要目标是AGI,而非短期商业化,即使面对价格战,他们也没有改变方向。所以当用户快速增长时,他可能会首先评估这是否符合他们的长期目标。作为INTJ,他可能会冷静分析这种增长是否可持续,是否有助于技术发展,而不仅仅是数字的上升。

然后,考虑到他注重开源和技术共享,可能会利用这个机会进一步推动技术生态建设,而不是急于变现。例如,开放更多API,鼓励开发者参与,巩固开源社区的地位。此外,面对大量用户涌入,技术团队可能需要处理 scalability的问题,确保服务稳定,同时保持研发进度。 另外,作为理性思考者,他可能会担心用户激增带来的资源压力,比如算力需求增加,维护成本上升,尤其是在国内芯片受限的情况下。他可能会寻找解决方案,比如优化模型效率,或者与其他公司合作,但不会轻易妥协技术路线。 同时,用户的增长可能会带来外界的关注和舆论压力,作为低调的创始人,他可能会保持原有的沟通策略,避免过度曝光,专注于技术问题。

不过,也可能需要面对媒体和公众的期待,他可能会通过团队或官方渠道发布技术进展,维持透明度,同时不偏离核心目标。 最后,考虑到他的理想主义,即使面对商业诱惑,他可能会坚持原计划,继续投入AGI研究,认为长期的生态建设比短期收益更重要。

同时,用户增长可能被视为验证技术价值的机会,激励团队继续创新,而不是改变方向。

R1最终的回答:

365/年

CursorAI编程知识星球

我的cursor教学视频已经超100万人观看,可能是中文互联网最佳了

立即查看800+人已加入
免费

通过Monica免费使用满血可联网DeepSeek R1

Monica接入DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5,来提升您的聊天、搜索、写作和编程体验。

立即查看一站式 AI 助手