搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
5 小时
ICLR 2025 | 大模型“遗忘”竟是错觉?华南理工团队首次揭示LLM训练中 ...
近年来,大型语言模型(LLMs)在诸如安全对齐、指令微调等领域均取得了卓越表现。然而,在对这些模型进行持续训练时,人们经常观察到旧任务性能的骤降。传统观点往往将其归结为灾难性遗忘。但我们的最新研究发现,这种表观遗忘实际上是一种虚假遗忘——在大多数情况 ...
GitHub
20 天
wizard-a/fast-image-editor
. ├── canvas-components │ ├── canvas //画布组件 │ ├── layout //页面布局 │ ├── shape-panel // 右侧面板 │ └── transformer-wrapper // 支持transformer高阶组件 ├── components │ ├── color-select // 颜色选择器 │ ├── context-menu / ...
腾讯网
1 天
多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
腾讯网
13 天
深度|现代计算型强化学习之父:从瞬时到持续,迈向更好的深度学习
所谓的持续学习意味着你在任何时刻都在学习。每一刻都既是训练阶段,也是测试阶段。而传统的深度学习属于瞬时学习,因为它是在一个专门的训练阶段进行学习,随后在实际运行时就不再学习了。因此,将训练与测试分开,是一种非常不自然的做法。瞬时学习本身就是人为的设定 ...
2 天
高效学习泰语颜色词汇:技巧与策略
假设你在学习泰语颜色词汇时遇到了一些困难。你可以尝试以下方法: 情景模拟 :假设你在泰国市场购物,需要向摊主描述你想要的水果颜色。例如,你可以说:“ข้าวโพดสีเขียว (kʰâo pʰôd sī kʰiow)”(绿色的玉米)。
ZAKER on MSN
8 天
电子红包封面送给你,赶快领取吧
01 2025年春节来临,又到了要给亲朋好友发红包的季节了。快来领取专属于新闻传播领域人员的电子红包封面吧。 本期发送免费红包2000个,大家可以通过以下方式领取: 领取方式一:点击下方图片领取 ...
虎嗅网
2 天
DeepSeek狂飙13天:AI界开始真正严肃地思考未来
寻找梁文锋的人更是踏破铁鞋。外界对他的了解大多来自于2023年5月和2024年7月《暗涌》对他的专访。专访文章将他称为“一个更极致的中国技术理想主义者”。和OpenAI创始人山姆·阿尔特曼 (Sam Altman) ...
3 天
狂飙13天:开源DeepSeek如何撼动全球AI市场
2025年1月中旬,英伟达CEO黄仁勋的中国之行备受瞩目。从北京到深圳,再到台中和上海,这位AI时代的“卖铲人”每到一处都掀起一阵热潮。然而,就在距离英伟达上海办公室仅200公里的杭州,一场足以撼动AI产业格局的风暴正在悄然酝酿。彼时,身家1200亿 ...
sinchew
1 天
张晋玮.DeepSeek是创新还是抄袭?
从更宏观的角度来看,在中美人工智能博弈中,两国的相互制衡维持着一定的势力平衡,而对于小国如大马而言,这种竞争反而提供了更多选择空间,让小国能在不同阵营中各取所需,这未必是一件坏事。中国人工智能登上新闻头条!中企推出的DeepSeek ...
快科技
18 天
北森控股宣布收购酷学院 华兴资本担任酷学院独家财务顾问
北森此次收购是强化其市场领先地位、布局AI-Learning转型的重要战略举措;该交易同样是本年度中国SaaS行业首笔并购交易。 据IDC的数据显示 ...
eeworld.com.cn
4 天
DC2407A,基于 LT8650S 双通道 42V、4A 同步降压 Silent Switcher 2 的演示板
DC2407A 演示电路是一款双通道42V、4A 同步降压型 Silent Switcher,静态电流为 6.2uA,采用 LT8650S。 LT8650S 是第二代 Silent Switcher,可最大限度地降低 EMI 并降低 PCB 布局敏感性。该演示电路有两个输出:5V 和 3.3V。每个输出可同时提供高达 4A 的连续电流。传导 EMI 测量 ...
7 天
直接干穿美国科技股,DeepSeek这国产模型凭啥?
这么说吧,传统大模型训练里边,非常注重标注数据微调( SFT ),也就是让大模型先按人类标注好的标准答案来学习,学着说人话;如果想要大模型性能强些,那还要再在 SFT 基础上加一些强化学习( RL ),让大模型的理解能力更好。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈