最近,AI界出现了一匹黑马——DeepSeek。这个名字可能对很多人来说还比较陌生,但它已经在全球范围内引发了巨大的关注,甚至让一些科技巨头感到了压力。
而且,它还是一个开源模型。
这款新模型延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现。
所以,很多业内人士甚至喊出了“DeepSeek接班OpenAI”的口号。
比如,前Meta AI工作人员、知名AI论文推特作者Elvis就强调,DeepSeek的论文堪称瑰宝,因为它探索了提升大语言模型推理能力的多种方法,并发现了其中更明确的涌现特性。
今天,就让我们一起走进DeepSeek的世界,看看它到底有什么厉害的地方。
01 DeepSeek是什么?
DeepSeek(中文名:深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型。它的英文名“DeepSeek”可以读作“深思”(Deep)和“探索”(Seek),寓意着通过深度学习技术探索未知的领域。
简单来说,DeepSeek想要让机器像人类一样思考和学习,而不仅仅是执行简单的指令。
DeepSeek的核心是一个强大的语言模型,它能够理解自然语言并生成高质量的文本内容,无论是回答问题、撰写文章,还是进行复杂的推理,DeepSeek都能轻松应对。
02 DeepSeek有什么厉害?
DeepSeek 的模型在性能上接近美国顶尖AI模型,但研发成本极低。
DeepSeek-R1模型的训练成本仅为560万美元,远低于美国科技巨头数亿美元乃至数十亿美元的投入。
这种低成本、高效率的模式直接挑战了美国依靠高算力、高资本建立的人工智能发展模式。
DeepSeek还免费让全球开发者自由下载和使用,这不仅加速了AI技术的普及,也削弱了美国在AI技术上的垄断地位。
DeepSeek的崛起引发了美国科技股的大幅下跌。受DeepSeek冲击,美国芯片巨头英伟达股价暴跌17%,博通下跌17%,AMD下跌6%,微软下跌2%。
美国科技行业的“霸主地位”遭遇史无前例的挑战。
DeepSeek的应用程序在苹果应用商店的下载量超越ChatGPT,成为排名第一的免费应用程序。
这ChatGPT啊,可是美国的宝贝啊,以前那可是风光无限,觉得自己是AI界的霸主。但是现在呢,被DeepSeek给超越了。
美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”,并强调美国需要集中精力赢得竞争。
03 传统的技术路线,和DeepSeek R1的RL强化学习策略
从技术原理上来说,DeepSeek的成功,尤其是最新一代DeepSeek R1的成功,来自于它所采用的RL强化学习策略,这是它以极低的成本却可以实现和GPT-4o差不多效果的根本原因。
要理解这种颠覆性,得先看清传统AI的局限。
以GPT为代表的AI,其策略的本质是"在人类监督下的猜字谜游戏"——GPT们其实并不会思考,它们虽然会生成看上去还挺靠谱的回答,但它们做出这些回答并不是它们了解事物运行的原理,而是这样回答有更大概率被人类所接受。
这种猜字谜的游戏,最多也就是生成一些"看似靠谱实则无法深究"的东西,根本没有办法投入现实、转化为生产力工具。早期绘画AI经常把人画出六个指头也是类似的原因——AI根本不知道人的手掌上应该有几个指头,它只是生成一个"乍一看还可以"的东西。
但DeepSeek不一样,DeepSeek是真的会“思考”,或者说“推理”的。
以现在爆火的DeepSeek R1来说,它完全抛弃了那种"猜字谜"的训练方式,转而采用了之前在围棋和智能驾驶领域常用的RL策略(强化学习)。
如果说以前的策略是人类告诉AI什么是对的什么是错的,AI只是在人类的指导下对人类进行模仿。那么RL就是人类仅仅起一个"引进门"的作用,剩下的"修行"就全部靠AI自己慢慢学习了。
这种"修行"在最初阶段或许很笨拙,但越训练AI的能力就越强——关键在于AI不需要遵循人类的生理极限。人类要吃饭睡觉,但AI不用,在高性能芯片的加持下,AI训练一年所见识过的棋局、游戏,往往比一个职业棋手、职业电竞玩家十辈子见过的都多——老司机哪怕开一辈子车,最多也就开个几百万公里。但自动驾驶AI只要开始训练,公里数就是以亿为单位计算了。
简而言之就是:RL策略,是真正地让AI学会认识世界、了解事物规律,而不是亦步亦趋地迎合人类的口味——这也就是为什么很多人在看到DeepSeek的成功后都认为2025年将会是RL强化学习的元年。
没办法,RL策略现在看来确实是太诱人了。
04 技术突破带来的降本增效
当技术路线换道超车,成本结构就会发生核爆式变革。
因为底层的技术路线上颠覆了以GPT为代表的传统AI,所以DeepSeek R1把性价比拉高到了一个不可思议的程度——相比起硅谷那群人动辄数亿数十亿美金的投资和数万张显卡的超级集群,我们仅仅靠着2000多张显卡和600万美元左右的成本就实现了近似乃至更好的效果。
用美国META公司一位匿名员工的话来说:"META内部一个负责AI项目的高管年薪拿出来,就足够训练DeepSeek了,而这样高薪的高管,META有几十个。"
同时,这波操作直接改写了游戏规则。DeepSeek的颠覆式创新也向外界传播了一个信息:不需要那么高的投入,也不需要那么多英伟达的GPU,你也可以做出很棒的大模型——OpenAI训练GPT-4耗费约6300万美元和25000张A100显卡,而DeepSeek R1仅用600万美元达到可比效果,甚至可能用的还是国产显卡。
数据最能说明问题:RL策略使模型在对话轮次、任务复杂度等维度实现80%的收敛速度提升,数据利用率提高5倍以上。黄仁勋一觉醒来,感觉自己家的地基被人刨了,因为AI的泡沫眼看着就要被戳破了——在传统技术路径下,90%的算力消耗在试错过程中,而DeepSeek的自主学习机制能将无效训练降低60%。RL策略对并行计算的需求较传统架构下降40%,这使得国产显卡在特定计算任务中能达到英伟达GPU 75%的能效比。这就带来了更大的打击:算力市场上的格局将会被重构——随着华为昇腾910B等国产芯片在RL框架中表现持续优化,美国试图通过A100/H100禁运遏制中国AI发展的策略正加速失效——国产显卡又不是不能用,那我为啥还要高价进口呢?既然如此,那么美国的"小院高墙"的制裁路线还有意义吗?靠芯片靠GPU还能卡住东方大国的脖子吗?
05 DeepSeek的爆火背后的几点观察
毫无疑问,DeepSeek确实是取得了巨大的成功,而且使用体验的确远超GPT系列的大模型,尤其是R1版本特有的思考过程,真的不再是单纯模仿人类,而是真的有自己的想法,甚至比人类更全面、更周密。
第一,RL路线的含金量已经不再需要怀疑,必然会是下一个阶段AI大模型的核心策略。这也意味着我们向着真正的“人工智能”开始了前进。
第二,靠着堆显卡、堆资本来发展AI的“Scaling law”的价值需要被重新审视,这不意味着Scaling law的崩盘,反而可能是Scaling law的二阶段形态。因为虽然定价已经虚高了,并不需要这么多钱也可以实现很棒的效果,但不意味着英伟达就是割韭菜——不得不承认,如果有更好的条件,AI必然会有更大的进步。
第三,AI行业可能真的没有什么核心的护城河,模型技术的超越将会是常态。今天DeepSeek超越了OpenAI,明天指不定有人也能超越DeepSeek——整个行业的格局没有固化,中美AI竞争的大局还早着呢。
第四,DeepSeek的成功确实意味着之前一个阶段里美国的“小院高墙”制裁策略失效了。但对我们来说,硬件上的突破和国产替代之路远未结束。国产GPU还要继续发力,这是基础性的力量,不能因为DeepSeek的成功,就觉得咱们已经不需要再警惕英伟达的技术优势了。
06 应用举例:怎么看实体商业的未来,以下是DeepSeek 的回答
困境:流量流失、成本高企与“僵尸化”危机
“当抖音直播间里‘八个瑞士卷’的狂欢能创造单日百万销量,而实体商场的黄金铺位却开始挂出招租广告时,传统零售的傲慢终于被现实狠狠打脸。”
站在2024年的十字路口,国内商场仿佛被卷入了一场无声的风暴。
曾经熙熙攘攘的商场中庭,如今冷清得能听见脚步声的回响。北京某高端商场整层空置的“鬼城现象”,上海某老牌百货日均客流量跌破三位数的惨淡数据,都在诉说着同一个事实:传统商场正面临生死存亡的考验。
流量枯竭:从目的地到“背景板”
年轻人不再愿意为“千篇一律的标准化货架”买单。他们宁可挤在山姆会员店的试吃队伍里,或者钻进社区底商的手工咖啡店——那些能提供“情绪价值”的空间。
电商的围剿、社区商业的崛起,让商场逐渐沦为“路过但不进入”的背景板。
一位95后消费者在社交媒体上吐槽:“商场里的品牌和五年前有什么区别?连试衣间的镜子都长得一模一样。”
体验僵化:当“卖货逻辑”撞上“情绪消费”
消费者要的不再是商品,而是能引发情感共鸣的体验。
可惜多数商场还在沿用上世纪90年代的运营思维:整齐排列的货架、程式化的促销活动、永远播放着流行音乐的广播系统。
一位商业地产从业者自嘲:“我们就像在给Z世代放黑白电影,他们却早就用上了VR眼镜。”
破局:从“货架逻辑”到“情绪引擎”
危机倒逼变革,一批先行者已撕开裂缝,让光透进来。从定位逻辑,再到调改升级,再到折扣经济,宠物友好和社区化,一些线下商业项目已经开始了尝试。
定位破局:从“卖货场”到“情绪容器”
面对困局,全球商场正以近乎偏执的垂直细分策略重构消费逻辑——“不取悦所有人,只征服一小撮人”。
就比如成都华商金融中心:你可以说它是舌尖上的阶级折叠。从人均30元的钵钵鸡到人均3000元的黑珍珠餐厅,这座“全餐饮Mall”让打工人的午餐与富豪的晚宴共享同一片星空穹顶。有食客戏称:“在这里,你吃的是菜,品的是社会分层。”
调改升级:老瓶装新酒,更要装“烈酒”
上海新天地南里的改造堪称教科书级案例。设计师将废弃工厂的钢架结构保留为艺术装置,引入沉浸式戏剧《不眠之夜》的衍生体验区,顶层天台变身限时开放的“落日电影院”。
改造后,日均客流量逆势增长30%,年轻人举着鸡尾酒在锈迹斑斑的传送带旁自拍的场景,成为社交平台热门打卡点。
这揭示了一个残酷真相:存量改造不是简单的“刷漆换招牌”,而是要用文化叙事重构空间灵魂。当商场开始贩卖记忆、艺术甚至虚无缥缈的氛围感,消费者才会心甘情愿为溢价买单。
折扣经济:中产的“面子与里子”博弈
OPENRACK开时闪的爆火,精准戳中了当代中产的消费痛点。这个主打“奢侈品下水道”概念的线下特卖品牌,把短周期、高折扣的闪购模式玩到极致。
白领们午休时间冲进商场,用三折价格抢走陈列在丝绒展台上的过季大牌包包,既满足虚荣心又守住钱包。
单店日均百万的销售额证明:消费降级时代,“既要面子又要里子”的矛盾心理,本身就是门好生意。
宠物友好+社区化:从“购物中心”到“生活枢纽”
这个问题上,曼谷CENTRAL WESTVILLE的转型令人耳目一新。这里不仅有大家公认的养宠条例,宠物推车,还有宠物烘焙工坊、带按摩浴缸的狗狗SPA馆,还在中庭设置了配备宠物饮水机和玩具的“社交角”。
周末的商场里,牵着柯基犬的年轻人和推婴儿车的家庭主妇擦肩而过,各自在同一个空间找到归属感。运营数据显示,家庭客群停留时长从1.2小时提升至3.5小时,连带餐饮业态销售额增长45%。
这背后的商业逻辑很明显:当商场成为解决孤独、连接社区的“第三空间”,消费者自然会用停留时间和复购率投票。
07 DeepSeek在线下商业中的角色
做商场的“神经中枢”
“当商场连‘氛围感’都要靠算法设计时,我们或许正在见证商业史上最荒诞也最精彩的进化——技术没有杀死人性,反而把人性欲望解剖得更加赤裸。”
在这场变革中,技术公司不再是旁观者。以DeepSeek为代表的AI服务商,有可能成为线下商业转型的“神经中枢”,为团队创造价值。
破解流量困局:从“大海捞针”到“精准狙击”
通过情绪分析模型,DeepSeek能实时抓取社交平台上的热点话题。
当“麦麦熏鸡”梗在微博爆发时,某商场迅速联合麦当劳推出“AI算命炸鸡盒”——消费者扫描包装盒上的二维码,就能获得结合消费记录的个性化运势解读。
活动期间,商场客流同比增长18%,炸鸡单品销量暴涨300%。
供应链瘦身:让库存“流动”起来
某区域连锁超市曾饱受“爆款缺货、滞销品堆积”困扰。
引入DeepSeek的智能补货系统后,AI根据门店位置、客群特征甚至周边竞对动态,实现“千店千面”的库存配置。半年时间,采购成本下降12%,缺货率从8%骤降至2%,就连最难预测的酸奶临期品损耗也减少了35%。
创新方向:效率与情绪的终极博弈
线下商业的未来,本质是两套生存法则的角力。
效率战争:Costco用会员制模型证明,极致供应链效率可以创造忠诚度。
当商场能通过AI预测把榴莲的报废率控制在1%,用动态定价让羽绒服在寒流来临前夜自动调价,价格优势就会转化为护城河。
情绪战争:茑屋书店的“生活方式提案”给出了另一种答案。
它卖的不是书,而是“如何度过周末下午”的想象。当商场能通过宠物社交角治愈孤独,用元宇宙试衣间满足虚荣,消费者就会为多巴胺持续买单。
胜负手,在于平衡:郑州正弘城的案例颇具启发性。这里既有依靠AI算法实现“2小时极速补货”的超市,也有每月更换主题的艺术中庭。消费者可以上午在无人收银台用3秒完成结算,下午坐在数字投影打造的“樱花雨”中喝手冲咖啡。这种“左手效率、右手情怀”的模式,让它成为2023年少数实现两位数增长的商场。
结语
站在新商业文明的起点,2025年的商场注定要完成三重蜕变:
"从商品陈列馆到情绪游乐园",用宠物、艺术、折扣制造“成瘾体验”;
"从成本中心到效率工厂",让AI穿透供应链的每个毛孔;
"从孤立建筑到社区器官",成为连接人与人的温暖枢纽;
那些仍沉迷于“全场五折”的玩家,终将被埋葬在旧时代的尘埃里。而敢于拥抱DeepSeek这类技术伙伴的革新者,正在用算法解构欲望,用数据重塑温度——毕竟在这个时代,能活下来的不是最强大的物种,而是最能适应变化的玩家。
“要么进化,要么消亡。”这不再是一句口号,而是写进每个商场DNA的生存法则。