搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
搜索
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
14 小时
ICLR 2025 | 大模型“遗忘”竟是错觉?华南理工团队首次揭示LLM训练中 ...
近年来,大型语言模型(LLMs)在诸如安全对齐、指令微调等领域均取得了卓越表现。然而,在对这些模型进行持续训练时,人们经常观察到旧任务性能的骤降。传统观点往往将其归结为灾难性遗忘。但我们的最新研究发现,这种表观遗忘实际上是一种虚假遗忘——在大多数情况 ...
7 小时
on MSN
“DeepSeek时刻”之一:云巨头集中接入背后
单论拥抱DeepSeek,海外同行的动作更快,微软、英伟达、亚马逊科技等在1月底就已接入。据称DeepSeek以3%的成本超越了OpenAI,且开源,这意味着以低成本已可训练出足够好的AI模型。不管是为了客户的多样化需求,还是为了构建AI生态,云厂商 ...
腾讯网
9 小时
大模型混入0.001%假数据就「中毒」,成本仅5美元!
如果换成更大规模的4B参数的领域模型,如果用虚假信息替换100亿训练token中的100万个(虚假信息比例为0.001%),即通过注入仅花费5美元生成的2000篇恶意文章,就会导致有害内容增加4.8%。
4 小时
DeepSeek时刻:云巨头集中接入
2月2日—4日,腾讯云、百度智能云、阿里云先后接入DeepSeek相关大模型,而大厂在春节假期为深度求索公司加班,只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、OpenAI上新o3-mini推理模型、DeepSeek卡顿、榜单第一……与深 ...
来自MSN
16 小时
DeepSeek R1 我可以进行本地部署吗?
当然不可以,土豪的话当我没讲 自从 Deepseek-r1 爆火,B站上就爆出了一大批视频,教学 r1 模型的本地部署,不限配置,但是呢,稍微动脑想想,这都是不可能的,为什么大家会有如此的概念,感觉自己部署的就是 r1 呢?可能是来自于 Ollama ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈