DeepSeek:来自东方的神秘力量
过年期间,一款名为DeepSeek的人工智能产品迅速走红,引发了全球科技界的广泛关注。DeepSeek全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家专注于开发先进大语言模型(LLM)及相关技术的创新型科技公司。
在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”。2024年底,DeepSeek发布了新一代大语言模型V3,随后在2025年1月20日推出开源模型R1,再次震撼全球AI领域。R1模型实现了重要的技术突破——通过纯深度学习方法让AI自发涌现出推理能力。这款人工智能助手一经发布便在全球范围内掀起热潮,不仅在中国区和美国区苹果AppStore免费榜上均位列首位,还超越了包括ChatGPT在内的多个知名AI产品。
DeepSeek的技术优势与市场表现
DeepSeek的产品不仅在技术上表现出色,在市场上也获得了巨大成功。其新模型DeepSeek-R1以十分之一的成本达到了GPT-1级别的表现,大幅降低了推理模型的成本,引发了海外AI圈的广泛讨论。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设计成本不到600万美元,堪称“小力出奇迹”。
阿里云、百度智能云、华为云、腾讯云等国内四大云巨头均已正式支持DeepSeek。此外,亚马逊AWS、微软Azure等海外云巨头也已官宣支持。多家国产芯片厂商如天数智芯、摩尔线程等也积极响应,支持DeepSeek模型,实现了从芯片到平台,从算力到模型的全国产研发和制造。
推动AI平民化
随着DeepSeek掀起新一轮AI热潮,不少普通人开始关注未来生活是否会因此改变。正如iPhone的发明彻底改变了人们的生活方式,DeepSeek也被视为推动AI实现“平民化”的重要力量。建立在开源AI系统之上,更多的开发者能够开发出有用的AI应用场景,使AI真正走进普通人的生活。
AI开源初创公司HuggingFace联合创始人Thomas Wolf表示,人工智能的下一步将是“应用”。他强调,虽然大家都在谈论性能强大的AI大模型,但更关键的是如何在这些模型之上建立应用,让模型在现实生活中变得有用,从而惠及每个人。
遭遇网络攻击
然而,DeepSeek的成功也引来了不法势力的关注。1月30日凌晨,奇安信XLab实验室监测发现,针对DeepSeek线上服务的攻击烈度突然升级,攻击指令较1月28日暴增上百倍。至少有两个僵尸网络参与了此次攻击,共发起了两波次攻击。中国常驻联合国代表傅聪在记者会上指出:“从华为到TikTok,再到DeepSeek,美国还想禁多少?”他表示,DeepSeek引发的全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效。
为何DeepSeek让美国感到紧张?
DeepSeek之所以让美国感到紧张,主要归结于以下几点:
1. 高性价比:DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%,冲击了美国大模型的垄断地位。
2. 模式创新:DeepSeek采用算法优化数据处理,而不是简单地堆砌算卡,这不仅降低了成本,还提升了模型性能,引发了美国技术人员的恐慌。
3. 进步显著:根据《人工智能大模型年度发展趋势报告》,国内外大模型能力差距在2023年第四季度到2025年第一季度缩小了近75%,DeepSeek的出现是这一趋势的阶段性成果体现。
DeepSeek的崛起不仅展示了中国在AI领域的创新能力,也为全球AI发展注入了新的活力。