突然爆火,超越ChatGPT!中国“神秘力量”震动美国科技圈
近日,神秘力量国产AI DeepSeek在中国、突然爆火美国的国震国科科技圈受到广泛关注,甚至被认为是动美大模型行业的最大“黑马”,在外网,技圈DeepSeek被不少人称为“神秘的神秘力量东方力量”。
1月27日,突然爆火DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,国震国科在美区下载榜上超越了ChatGPT。动美同日,技圈苹果中国区应用商店免费榜显示,神秘力量DeepSeek成为中国区第一。突然爆火
苹果美国区应用商店
苹果APP Store中国区免费榜
1月27日
相关微博热搜刷屏
图为热搜截图
游戏科学创始人、CEO,动美《黑神话:悟空》制作人冯骥评价DeepSeek:可能是技圈个国运级别的科技成果。
冯骥评价DeepSeek
DeepSeek是啥?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。
DeepSeek正式开源R1推理模型
据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek写春联 图源:证券时报
DeepSeek为何突然爆火?
26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。
对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。
DeepSeek突然蹿升 资料图
据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。
据广州日报报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。
更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。
郑磊直言,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。
团队不到140人,都来自国内顶尖高校
DeepSeek之所以能取得这些创新并非一日之功,而是“孵化”数年之久,长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。
梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。
此前,OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”,对此,梁文峰在接受自媒体采访时曾透露过,并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。
来源:中国新闻社综合自DeepSeek官方微信、澎湃新闻、每日经济新闻、界面新闻、财联社、广州日报、证券时报等
主编:刘倩
本期责编:何瑜婷
责任编辑:荀建国_NN7379相关文章
- 【建材网】09年8月27日,意大利SAVIOFIRMINO产品全线登陆中国。同年11月28日,圣罗兰集团旗下品牌瑞凰精品家具在京城北四环华仑大厦盛大开业。而刚进入2010年,进口高端品牌家具开店势头仍2025-01-31
- 雅安发展投资有限责任公司以下简称:雅投公司)突出国企特色、突出学史力行、突出担当作为,扎实推进党史学习教育,围绕群众需求办实事,把学习教育成果转化为推动发展、改善民生的强大动力和工作实效。关爱特殊儿童2025-01-31
高通骁龙主题馆将登陆2024 ChinaJoy,全方位呈现数字娱乐无限可能
2024年7月26日至29日,第二十一届中国国际数码互动娱乐展览会(ChinaJoy)将在上海新国际博览中心开展。今年,高通公司将携手小米、荣耀、一加、iQOO、红魔、ROG、星纪魅族、realme真2025-01-31- 名山区检察院守护群众“脚底下的安全”自政法队伍教育整顿工作开展以来,名山区人民检察院坚持将“我为群众办实事”实践活动贯穿党史学习教育和队伍教育整顿始终,重点在“实”上下功夫,推出一系列便民利民举措,用2025-01-31
- 【建材网】对家具有破坏花高额的费用随着消费者环保意识增强,室内空气污染检测已经逐渐被大众认可。但是与此同时,家具环保检测却“孤掌难鸣”,消费者对此多是望而却步。家具环保检测真的2025-01-31
终端过亿的NVIDIA RTX AI PC如何赋能新一代AI应用
自从2012年AlexNet在一台双路GTX 580的PC上完成训练、发布论文并震惊世界以来,基于以CUDA为代表的GPGPU工具栈的深度学习神经网络技术不断发展,如今已经成为包括ChatGPT2025-01-31
最新评论