第一批DeepSeek开发者，已经开始逃离了（组图）

2025-02-20 来源：字母榜原文链接评论0条

在DeepSeek服务繁忙的回复背后，不只是普通用户的焦急等待，当API接口响应突破临界阈值，DeepSeek开发者的世界，也出现了持续震荡的蝴蝶效应。

1月30日，接入DeepSeek的base北京的AI开发者林森，突然收到程序后台报警，还没来得及为DeepSeek的出圈高兴几天，林森的程序便因为无法调用DeepSeek，后台被迫瘫痪了3天。

一开始，林森以为这是因为在DeepSeek的账户余额不足导致的。直到2月3日春节假期过后返工，他终于接到了DeepSeek暂停API充值的通知。此时，尽管账户内余额充足，他也无法再调用DeepSeek了。

林森接到后台通知的第三天，DeepSeek官方于2月6日正式对外发布公告，宣布暂停API服务充值。近半个月过去，截至2月19日，DeepSeek开放平台的API充值服务仍未恢复正常。

第一批DeepSeek开发者，已经开始逃离了（组图） - 1

图注：DeepSeek开发者平台仍未恢复充值

图源：字母榜截图

在意识到后台瘫痪是由于DeepSeek服务器过载，而自己作为开发者，长达数天，却没有收到任何提前告知，更没有任何售后维护服务时，林森有种“被抛弃”的感觉。

“就像家门口有一家小店，你是老顾客，办了卡，一直和老板相处很好。突然有一天，小店被评为米其林餐厅，老板把老顾客抛在一边，之前办的卡也不认了。”林森形容道。

作为2023年7月开始部署DeepSeek的第一批开发者，林森为DeepSeek的出圈感到振奋，但如今，为了维持运转，他只能切换至ChatGPT，毕竟“ChatGPT虽然贵一点，但至少稳定。”

当DeepSeek从口口相传的小店变成网红打卡的米其林餐厅，更多和林森一样调用无门的开发者们，纷纷开始逃离DeepSeek。

2024年6月，小窗AI问答机在产品早期阶段就接入了DeepSeek V2，让小窗合伙人娄池颇为惊艳的是，那个时间点，DeepSeek是唯一能全文背诵《岳阳楼记》不会出错的大模型。因此，团队用DeepSeek承担了产品最核心的功能角色之一。

但对于开发者而言， DeepSeek虽好，稳定性却始终有所欠缺。

娄池告诉字母榜（ID：wujicaijing），春节期间，不仅是C端用户访问繁忙，开发者们也时常无法调用DeepSeek，团队决定选择几个已经接入DeepSeek的大模型平台同时调用。

毕竟，“现在已经有几十个平台有满血版DeepSeek R1了。”用这些大模型平台的R1，配合Agent和Prompt，也能满足用户的需求。

为了争抢DeepSeek外溢而出的开发者群体，有头部云厂商开始面向开发者频频举办活动， “参与活动就免费送算力，如果不大批量调用，小开发者几乎能免费使用。”易标AI技术总监杨惠超表示。

不过，DeepSeek热度当前，在第一批开发者们出逃之际，更多开发者仍在蜂拥而至，希望蹭到前者的流量红利。

郗鉴创业的项目，是通过调用DeepSeek的API来进行角色扮演的AI陪伴APP，2月2日上线首周就获得了约3000名的活跃用户。

尽管有用户反馈DeepSeek的API调用时有报错，但已经有60%的用户希望郗鉴尽快推出安卓版。在郗鉴的社交媒体后台，每天都有至少几十个用户私信要下载链接，“搭建在DeepSeek上的AI陪伴平台”，无疑成了APP出圈的新标签。

经字母榜统计，在DeepSeek官网内收录的接入DeepSeek的各类APP名单，2025年前APP名单仅有182行，如今已经扩展到了488行。

一面是DeepSeek成为“国产之光”爆火出圈，7天涌入1亿用户，另一面，则是第一批部署在DeepSeek上的开发者，正因为过载人流导致的服务繁忙，而纷纷转投其他大模型。

对开发者而言，长时间的服务异常不再是简单的故障，而演变成为代码世界和商业逻辑间的裂缝，他们被迫在迁移成本下进行生存演算，无论是涌入，还是逃出，开发者们都需要面对DeepSeek爆火带来的余震。

春节期间小程序后台被迫瘫痪三天后，至大年初六，为了保证程序正常运转的林森，离开已经部署一年多的DeepSeek，转回了ChatGPT。

即使API调用价格高了近10倍，但此时保证服务的稳定，成了优先级更高的选项。

值得注意的是，开发者离开DeepSeek转向其他大模型，并不如用户在APP内切换调用模型一般轻松。 “不同的大语言模型，甚至是同一个语言模型的不同版本，对于提示词的反馈结果都有细微的差别。”即便林森仍在持续调用ChatGPT，将所有关键节点从DeepSeek迁移ChatGPT，并保证稳定且高质量的内容反馈，仍然花了他半天多的时间。

切换这个动作本身也许只需要两秒钟，但“更多开发者，换一个新模型要花上一个星期反复调整提示词，并重复测试。”林森告诉字母榜，

在林森这样的小开发者们看来，DeepSeek服务器不足可以理解，只是如果能提前通知，能避免许多损失，无论是时间成本，还是APP维护成本。

毕竟， “登录DeepSeek开发者后台需要手机号注册，只需要一个短信，就可以提前告知开发者。”如今，这些损失将由曾在DeepSeek默默无名时就开始支持他们的开发者自己承担。

当开发者和某个大模型平台深度耦合，稳定性无疑成了不必宣之于口的契约，一个频繁波动的服务接口，足以让开发者重新审视对平台的忠诚度。

就在去年，林森在调用Mistral大模型（法国头部大模型公司）时，因为Mistral账单系统错误而重复付费，在他发出邮件后，Mistral不到1小时就纠正了问题，并附上了100欧元的代金券作为赔偿。这样的应对，也让林森产生了更多信任。如今，他也将一部分服务迁回到了Mistral。

易标AI技术总监杨惠超则在DeepSeek V3 版本发布之后，就开始酝酿一场逃离。

不用DeepSeek来写诗或者吐槽，如果用DeepSeek来写标书呢？负责公司内AI标书项目的杨惠超，在DeepSeek推出V3版本后已经着手寻找替代方案。对他来说，在标书这样的专业领域，“DeepSeek稳定性越来越不足。”

DeepSeek R1版本火出圈的推理能力，并不吸引杨惠超。毕竟， “作为开发者，软件主要的推理能力是靠程序和算法，并不是太依靠模型的基础能力。底层即便用最老的GPT 3.5，依靠算法纠正都可以产出一个很好的结果，模型只要回复答案稳定就可以。”

在实际调用过程中，DeepSeek在杨惠超眼中，似乎更像是一个聪明却会偷懒的“好学生”。

升级V3版本后，杨惠超发现，DeepSeek对一些复杂问题有了更高的回答成功率，但稳定性却也攀升到了难以接受的程度，“现在问10条问题，至少有一条输出不稳定，在要求生成的内容之外，DeepSeek往往喜欢自由发挥，额外生成和问题无关的内容。”

比如，标书内不允许出现错误字符，同时，大模型返回的结果，开发者们往往指定用Json 结构（用指令每次调用大模型使得稳定返回固定字段）去输出数据，便于后续函数调用，但出现错误或者不准确，都会导致后续调用失败。

“DeepSeek R1，或许相对此前的V3版本，推理能力提升了很多，但是稳定性达不到商业化的水准。”在@生产力Mark账号内，杨惠超提到。

第一批DeepSeek开发者，已经开始逃离了（组图） - 2

图注：DeepSeek V3生成过程中出现乱码

图源：@生产力Mark账号

作为2024年初，DeepSeek-coder时期就加入的第一批用户，杨惠超并不否认DeepSeek是一个好学生，只是如今，为了保证生成标书的质量和稳定性，杨惠超只能将目光转向国内其他更偏B端用户的大模型企业。

毕竟，曾经被称为AI界拼多多的DeepSeek，正是凭借着性价比的标签，迅速聚集起一批中小AI开发者。但现在想直接稳定地调用DeepSeek，就必须进行本地部署。 “部署一个 DeepSeek R1，需要 30万 ~ 40 万元的成本，如果用线上的 API计算，30万元我一辈子都用不完。”

既不够便宜，又不够稳定，调用无门的杨惠超们，正在批量离开DeepSeek。

曾经，林森们是第一批坚定选择DeepSeek的人。

2024年6月份，林森在开发自己的AI 小程序少年听世界时，曾经对比了当时国内外几十家大模型平台。他需要用大模型每天处理数千条新闻，并且筛选、排序，找出适合青少年听的科技、自然新闻，并且对新闻文字进行处理。

这不仅要求大模型聪明，还得便宜。

涉及到每天数千条的新闻处理，对token的消耗极大，对独立开发者的林森来说，ChatGPT模型很贵，只适合处理核心环节，对大量文本的快速筛选和分析，还要靠别的价格更低的大模型做支持。

同时，无论是国外的Mistral、Gemini ，还是ChatGPT，调用都很繁琐：你需要在国外有一个具体的服务器，还要做中继站，同时需要用国外的信用卡购买token。

林森便是通过英国朋友的信用卡，才能在ChatGPT账户完成充值。而一旦服务器在海外，API 响应速度也会有所延迟，这都让林森将目光投向国内，寻找一款ChatGPT平替。

DeepSeek让林森颇为惊艳。“当时DeepSeek并不是最有名的，但却是反馈最稳定的。”以每10秒请求一次API调用为例，其他国内大模型100次内可能有30%的时候，不返回任何内容，但DeepSeek次次返回，并都能维持不逊色ChatGPT和BAT们大模型平台的回复质量。

而相比起ChatGPT和BAT们的大模型API调用价格来说，DeepSeek真的太便宜了。

林森将大量新闻阅读和初步分析的工作交给DeepSeek后，发现DeepSeek的调用成本10倍低于ChatGPT。经过指令优化后，每天调用DeepSeek的成本低到2-3元，“可能跟 ChatGPT相比，它不是最好的，但DeepSeek的价格是极低的，对于我的项目来讲，它的性价比非常高。”

第一批DeepSeek开发者，已经开始逃离了（组图） - 3

图注：林森用大模型收录新闻并分析（左）最终呈现在少年听世界小程序（右）图源：林森提供

性价比，成了开发者们选择DeepSeek的首要原因。2023年，杨惠超一开始将公司的AI项目从ChatGPT 切换到了Mistral，主要便是为了控制成本。随后2024 年 5月份DeepSeek推出V2版本，将API打到了2元每百万token，这无疑是对其他大模型厂商的降维打击，这也成了杨惠超将公司做AI标书工具的项目切换到DeepSeek的缘起。

同时，经过测试后，杨惠超发现，国内早已靠云服务在B端吃下市场的BAT们，“平台太重了”。

对于易标AI这样的初创公司来说，如果选择BAT，会面临云服务的捆绑消费。对于只是简单调用大模型服务的杨惠超来说，无疑DeepSeek的 API 调用更加省事。

在迁移成本上，DeepSeek也胜了一筹。

无论是林森还是杨惠超，初始的APP开发都是基于OpenAI 的接口形式，如果切换到BAT们的大模型平台，都要把底层重新开发一遍。但DeepSeek兼容 OpenAI like接口，切换大模型只需要修改平台地址，“1分钟无痛切换。”

小窗AI问答机正式销售的第一天就搭载了DeepSeek，并将5个核心角色中语文和作文指导的角色交给了DeepSeek进行构建。

作为合伙人，娄池也在去年6月就被DeepSeek惊艳到。“DeepSeek在中文理解上能力很棒，是那个时间点唯一全文背诵《岳阳楼记》不会出错的大模型。”娄池告诉字母榜，相比起其他大模型中规中矩、班味十足的文档式输出，用DeepSeek教孩子写作文，往往赢在了写作的想象力上。

在社交媒体风靡用DeepSeek写诗、写科幻小说之前，DeepSeek的华丽文风，就让小窗AI团队眼前一亮。

对于开发者们来说，他们仍在期待DeepSeek恢复调用，眼下无论是迁移到BAT们部署了满血版DeepSeek R1的平台，还是转向其他大模型厂商，都似乎是“菀菀类卿”。

但竞争对手正在努力追平DeepSeek深度推理的出圈特长。

国内，近期百度、腾讯都陆续在自研大模型中加入深度思考能力；国外，OpenAI也在2月紧急上新“Deep Research”，把推理大模型的思考能力用于联网搜索，并将对Pro、Plus和Team用户开放。谷歌人工智能实验室（Google DeepMind）也在2月发布了Gemini 2.0模型系列，其中2.0 Flash Thinking实验版本则是一款增强推理能力的模型。

值得关注的是，DeepSeek仍然以文本阅读为主，但不管是ChatGPT还是Gemini 2.0，在支持深度思考之余，都已经将推理能力引入多模态，支持视频、语音、文档、图片等多种输入模态。

对DeepSeek来说，在追赶多模态之余，更大的挑战还来自竞争对手在价格上的逼近。

在云平台部署侧，一众头部云厂商都选择接入DeepSeek，一边分食流量，一边靠云服务绑定客户。对DeepSeek大模型的调用，某种程度上甚至成了绑定企业云服务的“赠品”。

百度创始人李彦宏近期提出，在大语言模型领域，“每12个月，推理成本就可以降低90%以上。”

在推理成本下降的趋势下，BAT们的API调用价格持续走低已成必然，DeepSeek的性价比优势，正在迎来大厂新一轮价格战的压力。

不过，大模型API价格战只是起步，面向开发者，大模型厂商们还拼起了服务。

第一批DeepSeek开发者，已经开始逃离了（组图） - 4

林森接触过大大小小众多的大模型平台，让他印象深刻的是，某科技大厂会有专门的客户经理进行对接，无论是不稳定还是出现技术问题，都会主动和开发者联系。

而尽管作为一个开源的大模型平台，目标是为开发者提供更普惠的AI支持，DeepSeek甚至在官网没有面向开发者出具发票的入口。

某头部大厂AI产品经理告诉字母榜，有的互联网公司leader坚持用DeepSeek替换原有大模型，完全不管替换模型重新调整Prompt所耗费的时间。同时，即便满血版的DeepSeek R1，也有不少通用能力如‌Function calling等并不支持。

相比起用云服务跑通了B端服务场景的BAT们，在便捷度上，DeepSeek仍然差着AI大厂一截。

只是DeepSeek的流量效应暂未褪去，赶潮人依然众多。

有部分公司宣称接入DeepSeek，只是开始调用API，充值了几百块。有的公司公告部署了DeepSeek模型，但其实只是让员工看了看B站教程，下载了一键安装包。在这波DeepSeek热潮里，泥沙俱下，鱼龙混杂。

潮水终将褪去，但DeepSeek要做的功课显然更多了。

欢迎在评论区留言~

关键词： DeepSeek API接口服务器过载开发者

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络[email protected]。