Llama 7B - 搜索 News

11 小时on MSN

支持API调用，国家超算互联网上线DeepSeek R1满血版

为满足资深开发者与企业端需求，国家超算互联网平台现已上线包括R1满血版的DeepSeek全家桶模型，并提供快速部署API调用及AI web应用服务，助力企业灵活构建专属AI应用。图说：DeepSeek-R1模型镜像创建界面 ...

12 小时on MSN

国产飞腾CPU完整支持DeepSeek：性能可达国外平台80％

快科技2月9日消息，飞腾官方宣布，飞腾腾云S5000C、飞腾腾锐D3000处理器已成功实现对DeepSeek全系列大模型的端到端支持，覆盖数据中心和终端场景，而且性能非常出色。其实在2024年，DeepSeek-V2.5 ...

来自MSN22 小时

国产芯片公司，全面拥抱Deepseek

DeepSeek 的最新模型震撼了美国主导的人工智能生态系统，使芯片领导者英伟达损失了数千亿美元市值。当行业领导者努力应对影响时，规模较小的人工智能公司看到了与这家中国初创公司一起扩大规模的机会。几家人工智能相关的公司向 CNBC ...

中国日报网1 天

激活AI产业链 DeepSeek持续扩大生态圈

DeepSeek不仅让中国生成式人工智能技术进入全球视野，同时也直接激活了整个人工智能产业链，无论是云服务厂商、芯片公司，还是下游应用层，均纷纷进行部署和适配。业内预期接下来一年有望成为AI应用爆发的黄金期。咨询机构Omdia预计，未来五年中国生成式 ...

1 天

关于DeepSeek，多家算力芯片公司宣布……

春节假期期间，DeepSeek的爆火如“平地一声雷”。这家于2023年成立的人工智能基础技术研究企业，在今年1月20日正式开源其R1推理模型，该模型在数学、代码、自然语言推理等任务上，性能比肩OpenAI-o1正式版，且开发成本仅为600万美元，仅相 ...

OFweek维科网1 天

DeepSeek引爆了AI，国产GPU集体撑腰

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，其起源于一家中国的对冲基金公司High-Flyer。2023年5月High-Flyer剥离出一个独立实体，也就是DeepSeek。这是一家致力于打造高性能、低成本的 AI 模型。它的目标是让 AI 技术更加普惠，让更多人能够用上强大的 AI 工具。

2 天

DeepSeek R1 震撼登场：从介绍到使用

DeepSeek 的创始人梁文峰出生于 1985 年，17 岁考入浙江大学，拥有信息与电子工程学硕士学位。2023 年，梁文锋宣布进军通用人工智能（AGI）领域，创办了 DeepSeek，致力于开发真正人类级别的人工智能。 DeepSeek ...

腾讯网2 天

显存狂降80%！Unsloth黑科技优化GRPO流程，让人人都能训自己的Deepseek R1

我们知道 Deepseek R1 核心的贡献是揭示了一个“aha”时刻，在 R1-Zero 中通过使用 GRPO （Group Relative Policy Optimization）在没有人类反馈的情况下自主学会了分配更多的思考时间。

2 天

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

2 天

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

一项非常鼓舞人心的发现是：DeepSeek-R1-Zero 通过纯强化学习（RL）实现了「顿悟」。在那个瞬间，模型学会了自我反思等涌现技能，帮助它进行上下文搜索，从而解决复杂的推理问题。

来自MSN3 天

大家都在部署本地DeepSeek R1，但是又有人极力反对本地部署？

菜菜不是虚名，是真的菜，所以发布的文章不是“教你做什么”，而是“我正在做什么”。如果恰好这个阶段你也正在玩这些，可能帮你节省一点时间，或者避开一两个小坑，仅此而已。今天起会发布一些DeepSeek相关的小文章，也是因为我最近在倒腾这玩意。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果