Distillation - 搜索 News

8 小时

DeepSeek掀起了大模型市场的价格革命。

导读THECAPITAL我们试图通过下面的梳理，分享从投资人视角如何看待DeepSeek，更重要的是超越这个单一事件如何抓住未来生成式AI带来的产业投资机遇。本文5689字，约8.1分钟来源 | ...

4 天

近日，上海AI实验室（上海AI Lab）在数学推理领域取得重大突破，通过强化学习（Reinforcement Learning，简称RL）技术，成功在数学推理能力上超越了DeepSeek，这一成果引发了广泛关注。上海AI ...

机器之心报道机器之心编辑部蒸馏模型的性能可以量化估算了。众所周知，知识蒸馏技术当前正被大模型领域广泛使用，它可以在大幅压缩模型体量的同时保持一定的性能、降低模型时延、提升模型精度，与此同时还能对知识域进行集成和迁移。近日，苹果研究人员提出了一种蒸馏扩 ...

5 天

知识蒸馏（Knowledge Distillation，简称KD）是由AI领域的三位大佬Geoffrey Hinton、Oriol Vinyals和Jeff ...

2 天

“这就是新现状，即美国和中国之间的差距几乎在一夜之间缩小了，但这并非一夜之间发生的，而是多年来进步的结果。”他提醒道：“如果说西方能够从中吸取到什么教训的话，那就是他们对于中国的了解极其有限——我们根本无法预测接下来会发生什么。” ...

2 天

加拿大咨询公司“地缘政治商业”（The Geopolitical Business）的创始人阿比舒尔·普拉卡什（Abishur Prakash）指出，DeepSeek的出现显示出西方对于中国的理解认知“极其有限”，“美国自认为的全球科技领导者地位已不再为人们所接受。” ...

在AI领域，扩展定律（Scaling Laws）已成为推动技术进步的核心概念。这些定律描述了AI系统的效能如何随着训练资料、模型叁数或运算资源的增加而提升。正如自然界中的物理定律一样，扩展定律为AI的发展提供了可预测的框架，并在近年来成为大型语言模型 ...

据观察者网报导，进入2025年以来，随着中国人工智慧（AI）初创企业深度求索（DeepSeek）震动整个行业，以及人工智慧行动峰会上周刚刚在法国巴黎举行，AI技术成为全球热议的热门话题。美国消费者新闻与商业频道（CNBC ...

来自MSN6 天

曾获Google、NVIDIA两大公司资源注资的台湾创业公司APMIC（Accelerate Private Machine Intelligence Company）与铨锴国际，共同推出软硬件集成的Test-Time Compute ...

6 天

现任首席科学家 Jeff Dean 、出走又回归的Transformer作者 Noam Shazeer ，与知名播客主持人Dwarkesh Patel展开对谈。

4 天

近日有媒体报道称，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

一些您可能无法访问的结果已被隐去。