Sonnet - 搜索 News

21 小时

DeepSeek 刚刚在 Cursor 平台上线了它的两款模型：DeepSeek V3 和 R1。目前，许多开发者（包括我们在内）主要依赖 Claude 3.5 Sonnet（最新版本 claude-3-5-sonnet-20241022）作为主要语言模型，因此我们决定对这几款新模型进行实战对比。

3 天on MSN

紫光自研大模型服务平台软件已纳管、上架 DeepSeek V3 / R1 模型

IT之家 2 月 7 日消息，DeepSeek 系列模型因其多次评测中的优异表现在全球范围内备受关注，相关测试结果显示，其性能接近甚至超越国际顶尖闭源模型（如 OpenAI 的 GPT-4、Claude-3.5-Sonnet 等）。

5 天on MSN

阿里云Qwen2.5-Max登顶AI大模型榜单，数学编程能力超群！

近日，阿里云在其官方渠道宣布了一项重大突破，其最新研发的通义千问Qwen 2.5-Max超大规模MoE模型在新年之际崭露头角。该模型在多个基准测试中表现出色，据称已超越了包括DeepSeek V3在内的多个竞争对手。具体而言，阿里云透露，Qwen2.5-Max在备受瞩目的Chatbot Arena大模型盲测中取得了令人瞩目的成绩。在这一由LMSYS ...

5 天

全球第一：阿里云宣布通义千问Qwen2.5-Max数学及编程能力登顶最新AI大 ...

IT之家 2 月 5 日消息，1 月 29 日新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，号称在多个基准测试中超越 DeepSeek V3 登竞争对手。阿里云今日宣布，Qwen2.5-Max 在 Chatbot Arena 大模型盲测中超越 DeepSeek-V3、Open AI o1-mini 和 Claude-3.5-Sonnet 等模型，以 ...

5 天

防范AI模型越狱，新技术保护措施来了

为了应对人工智能工具中存在的滥用自然语言提示的问题，Anthropic公司推出了一项名为“宪法分类器（constitutionalclassifiers）”的新概念。该技术将类似于人类价值观的宪法植入大型语言模型中，以防止模型超越安全 ...

东方财富网6 天

超DeepSeek V3！阿里云Qwen2.5-Max闯入全球盲测榜单前十

【超DeepSeek V3！阿里云Qwen2.5-Max闯入全球盲测榜单前十】2月4日凌晨，三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单，一周前刚发布的Qwen2.5-Max超越DeepSeek ...

每经网6 天

中国模型崛起！阿里Qwen2.5-Max数学及编程能力赶超OpenAI

Qwen2.5-Max是阿里云通义团队约一周前发布的最新MoE模型，展现出极强劲的性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

6 天

阿里云Qwen2.5-Max火速跻身全球前十！国产AI模型再创佳绩！

在科技领域的激烈竞争中，阿里云最新发布的Qwen2.5-Max模型，正如一颗耀眼的新星，闪电般闯入了Chatbot Arena的全球前十名！在刚刚更新的榜单上（日期：2月4日），Qwen2.5-Max不负众望，以1332分的优异成绩名列第七，超越了多款知名模型如DeepSeek V3和Claude-3.5-Sonnet。

6 天

中国模型崛起！阿里Qwen2.5-Max数学及编程能力全球第一

2月4日凌晨，三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单，一周前刚发布的Qwen2.5-Max超越DeepSeek ...

中华网9 天

美大模型巨头：DeepSeek没我们先进 AI竞争白热化

周三，Anthropic首席执行官达里奥·阿莫迪发布了一篇长文讨论了DeepSeek的进展。他指出，DeepSeek并没有“用600万美元做到美国AI公司花费数十亿美元才能实现的事情”。以Anthropic为例，Claude 3.5 ...

虎嗅网10 天

DeepSeek惊艳全球，美国大模型两巨头：并不比我们先进

本文来自微信公众号：华尔街见闻，作者：叶桢，原文标题：《DeepSeek惊艳全球，美国大模型两巨头齐发声：并不比我们先进》，题图来自：AI生成 DeepSeek ...

51CTO19 天

字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet

字节跳动旗下豆包大模型 1.5 Pro 正式发布，全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。 1 月 22 日消息，字节跳动旗下豆包大模型 1.5 Pro 今日正式发布，全新 Doubao-1.5-pro 模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果