DeepSeek掀起了 大模型市场的价格革命。
导读THECAPITAL我们试图通过下面的梳理,分享从投资人视角如何看待DeepSeek,更重要的是超越这个单一事件如何抓住未来生成式AI带来的产业投资机遇。本文5689字,约8.1分钟来源 | ...
近日,上海AI实验室(上海AI Lab)在数学推理领域取得重大突破,通过强化学习(Reinforcement Learning,简称RL)技术,成功在数学推理能力上超越了DeepSeek,这一成果引发了广泛关注。上海AI ...
机器之心报道机器之心编辑部蒸馏模型的性能可以量化估算了。众所周知,知识蒸馏技术当前正被大模型领域广泛使用,它可以在大幅压缩模型体量的同时保持一定的性能、降低模型时延、提升模型精度,与此同时还能对知识域进行集成和迁移。近日,苹果研究人员提出了一种蒸馏扩 ...
知识蒸馏(Knowledge Distillation,简称KD)是由AI领域的三位大佬Geoffrey Hinton、Oriol Vinyals和Jeff ...
“这就是新现状,即美国和中国之间的差距几乎在一夜之间缩小了,但这并非一夜之间发生的,而是多年来进步的结果。”他提醒道:“如果说西方能够从中吸取到什么教训的话,那就是他们对于中国的了解极其有限——我们根本无法预测接下来会发生什么。” ...
加拿大咨询公司“地缘政治商业”(The Geopolitical Business)的创始人阿比舒尔·普拉卡什(Abishur Prakash)指出,DeepSeek的出现显示出西方对于中国的理解认知“极其有限”,“美国自认为的全球科技领导者地位已不再为人们所接受。” ...
在AI领域,扩展定律(Scaling Laws)已成为推动技术进步的核心概念。这些定律描述了AI系统的效能如何随着训练资料、模型叁数或运算资源的增加而提升。正如自然界中的物理定律一样,扩展定律为AI的发展提供了可预测的框架,并在近年来成为大型语言模型 ...
据观察者网报导,进入2025年以来,随着中国人工智慧(AI)初创企业深度求索(DeepSeek)震动整个行业,以及人工智慧行动峰会上周刚刚在法国巴黎举行,AI技术成为全球热议的热门话题。美国消费者新闻与商业频道(CNBC ...
来自MSN6 天
APMIC携手铨锴国际推AI算力方案,支持李飞飞s1训练方法曾获Google、NVIDIA两大公司资源注资的台湾创业公司APMIC(Accelerate Private Machine Intelligence Company)与铨锴国际,共同推出软硬件集成的Test-Time Compute ...
现任首席科学家 Jeff Dean 、出走又回归的Transformer作者 Noam Shazeer ,与知名播客主持人Dwarkesh Patel展开对谈。
近日有媒体报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。 该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果