← 随机比特 / 所有内容

antirez ds4

2026-05-16 · 随机比特

都在焦虑 AI 垄断,Redis 创始人却在本地跑通了前沿大模型

这几天,Redis 创始人 antirez 看着自己桌上的高配 Mac,发了一段极其感慨的实战笔记:

“这是我第一次,把过去只能求助 Claude 和 GPT 的严肃工作,全部交给了一个本地运行的模型。”

他口中这个在本地跑起来的模型,是 DeepSeek V4(Flash 版)。

1. 砸碎“必须联网才能变聪明”的死局

在过去两年的 AI 浪潮里,所有认真写代码、做研发的人都被困在一个两难的死局里: 你想用最聪明的 AI,就必须把你的核心代码、业务数据甚至未公开的思考过程,顺着网线毫无保留地发送给远端的服务器。 你想保护隐私,在本地电脑上跑开源模型,就只能忍受那些“人工智障”——跑得慢,还总是在关键逻辑上胡言乱语。

但这个平衡,正在被硬件和极致的量化技术暴力打破。

antirez 现在的真实工作流是这样的: 利用一台 96GB 或 128GB 内存的个人电脑,跑着极端压缩(2/8 bit 不对称量化)的 DeepSeek V4。 在这样的消费级硬件上,它的速度极快,更重要的是,它的聪明程度已经越过了“可用”的及格线,直接逼近了最顶级的云端巨兽。

用 antirez 自己的感受来说:“如果你把以前的本地小模型体验比作 A,把云端顶级大模型比作 B,那现在的本地体验,已经远远偏向于 B 了。”

2. 把“思考”当水电租用,还是作为私有财产?

这并不是一个普通的极客硬核评测,这件事背后藏着一个正在发生剧变的行业断层。

过去一年,整个科技圈都在贩卖一种焦虑:随着大模型参数量飙升,未来的算力和智能会被极少数巨头彻底垄断。普通开发者和初创公司,注定只能沦为每个月按 token 给巨头交“智商税”的佃农。

在这个行业断层背后,是两条完全不同的演进路线。

<figure><img src=“images/01-cloud-vs-local.png” alt=“01-cloud-vs-local”></figure>

云端路线将模型视为不断涨价的“公共电力”,你的业务对 API 产生越深的依赖,被平台“卡脖子”或单方面降级的风险就越高;而本地路线则将智能视为完全由你掌控的私有财产,模型不需要无休止地堆砌参数,只需恰好匹配你的个人电脑内存,就能为你提供无需网络、无需审查的绝对专注。

但极致的模型压缩技术,和类似 DS4 这种准前沿模型的开源,硬生生在垄断的铁壁上砸开了一条裂缝。 那些原本被锁在云端数据中心里的庞大能力,正在被强行塞进开发者的桌面上。

现在的它还是一个通用模型。但如果顺着这个逻辑往下看,一旦这种能在本地流畅运行的庞然大物,被针对编程、法律、医疗等专业领域进行深度特化,那将诞生一个不需要联网、不需要看任何 API 脸色、完全私有化的超级外脑。

3. AI 太重要,绝不能仅仅是一项服务

很多人依然在研究怎么改写 prompt,或者套上层层脱敏工具,来防止云端 AI 偷看自己的核心机密。 但最顶级的开发者,已经在走另一条彻底摆脱控制的路。

在这篇笔记的结尾,antirez 留下了一句极为克制但极具穿透力的判断,这句话值得所有技术人截图保存:

“AI is too critical to be just a provided service.” (AI 太过关键,绝对不能仅仅沦为一项被提供的服务。)

这其实也是整个 AI 时代下半场的核心分歧: 真正的智能红利,不是你能花钱租到多聪明的云端 API。 而是「思考」这项最核心的生产力,终于可以不再是每月续费的水电,而是完全由你掌控的私有财产。