Deepseek Logo - 搜索 News

3 小时

据快科技消息，马斯克最近在社交平台发布了一则招聘启事，招聘资深软件工程师。马斯克表示，招聘标准非常简单直接，不关心应聘者的学历背景、工作经历，甚至不关心是否上过学或在“大牌”公司工作过，唯一的要求就是展示自己的代码作品（Just show us ...

Cryptopolitan on MSN3 天

China’s MiniMax debuts 3 open-source models to rival top US-made chatbots

MiniMax, a Chinese startup has released three low-cost open-source AI models, which it has pitched to compete with top ...

7 天

China’s AI disrupter DeepSeek bets on low-key team of ‘young geniuses’ to beat US giants

DeepSeek prefers to hire new graduates, or those early in their AI career, in line with the company’s preference for ability ...

来自MSN10 天

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

编辑：桃子好困【新智元导读】600万美金训出击败GPT-4o大模型，竟被中国团队实现了！今天，DeepSeek-V3在全网掀起巨大风暴，仅凭671B参数在数学代码性能上，堪比国外大模型Claude 3.5 Sonnet。一夜之间，来自中国的大模型刷屏全网。 DeepSeek-V3，一个拥有671B参数的MoE模型，吞吐量每秒高达60 ...

36氪16 天

DeepSeek-V3：美国芯片封锁的“意外”产物？

DeepSeek高效训练AI模型，减少硬件依赖。继电动车、消费品之后，中国团队又在AI领域上演了一出“成本屠夫”的好戏。用两个月、600万美元，就能 ...

凤凰网16 天

DeepSeek-V3：美国芯片封锁的“意外”产物？

用两个月、600万美元，就能训出一个能跟ChatGPT掰手腕的AI模型？Deepseek用实力演绎了“四两拨千斤”是什么意思。幻方量化旗下的DeepSeek公司宣布 ...

Yahoo18 天

Meet DeepSeek: the Chinese start-up that is changing how AI models are trained

Chinese start-up DeepSeek has emerged as "the biggest dark horse" in the open-source large language model (LLM) arena in 2025, just days after the firm made waves in the global artificial ...

虎嗅网20 天

深度拆解：DeepSeek-V3是怎么训练的

这两天，DeepSeek-V3 低调发布，在国际上狠狠秀了一波肌肉：只用了 500 多万美金的成本，带来了不输 Claude 3.5 的成绩，并开源！下面，让我们以更加系统的方式，来看看这次的 DeepSeek-V3，是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个维度来 ...

凤凰网21 天

DeepSeek V3“报错家门”：我是ChatGPT

只是少了一个问号，DeepSeek V3竟然称自己是ChatGPT。甚至让它讲个笑话，生成的结果也是跟ChatGPT一样：加之DeepSeek V3这次爆火的一个亮点，就是训练 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果