budget - 搜索 News

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

新智元报道编辑：犀牛【新智元导读】大模型推理性能的提升，真的只能靠堆数据、加算力吗？李飞飞等用仅1000个样本微调模型，并提出预算强制（budget ...

1 小时

近日，李飞飞和她的团队展示了一项令人惊叹的技术突破：通过仅使用1000个样本，他们成功微调出名为s1-32B的推理模型，并在多个基准测试中超越了OpenAI的闭源模型o1-preview。这项技术的核心在于所谓的预算强制（budget forcing）方法，该方法巧妙地调控模型思维的深度与时间，进而提升推理能力。

5 小时

训练1000样本就能超越o1，李飞飞等人画出AI扩展新曲线

今年 1 月，DeepSeek R1 引爆了全球科技界，它创新的方法，大幅简化的算力需求撼动了英伟达万亿市值，更引发了全行业的反思。在通往 AGI（通用人工智能）的路上，我们现在不必一味扩大算力规模，更高效的新方法带来了更多的创新可能。

Radio France Internationale9 小时

法国总理贝鲁成功挺过两次不信任动议 2025年国家预算获通过

法国总理贝鲁周三 (2月5日）成功挺过两次不信任动议，由于社会党和极右翼国民联盟（RN）不支持不信任动议，2025年国家财政预算草案得以顺利通过。

BBRTV北部湾在线3 小时

China taps ice, snow to fuel economic growth

Peng Fuwei, an official with the National Development and Reform Commission, China's top economic planner, said that China has established a dual manufacturing-service model to develop its ice and ...

See Hua Daily News21 小时

《我是Kelefe》亲上阵动作场面王雪晶首尝吊钢丝

（吉隆坡5 日讯）大马“贺岁女王”王雪晶相隔十年再拍电影《我是Kelefe》，片中她亲自上阵动作场面，圆了她从小想拍贺岁片的心愿，她与朱健美在戏中首尝吊钢丝，朱差点从楼上跌下，王雪晶还问问导演：“可以再来一次吗？”《我是Kelefe》主创人员编剧庞启明（左起）、陈丽瑜、张智扬、朱健美、导演 ...

财富中文网19 小时

在联合健康保险公司CEO遇刺后，各大公司是如何保护其高管的

去年12月，联合健康保险公司（United Healthcare）首席执行官布莱恩·汤普森（Brian Thompson）遇刺身亡，这一事件在企业领导层中掀起了新的焦虑浪潮，促使许多高管重新审视自身的安全问题，并重新评估现有的安全协议。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果