Learning 图片 - 搜索 News

5 小时

ICLR 2025 | 大模型“遗忘”竟是错觉？华南理工团队首次揭示LLM训练中 ...

近年来，大型语言模型（LLMs）在诸如安全对齐、指令微调等领域均取得了卓越表现。然而，在对这些模型进行持续训练时，人们经常观察到旧任务性能的骤降。传统观点往往将其归结为灾难性遗忘。但我们的最新研究发现，这种表观遗忘实际上是一种虚假遗忘——在大多数情况 ...

GitHub20 天

wizard-a/fast-image-editor

. ├── canvas-components │ ├── canvas //画布组件 │ ├── layout //页面布局 │ ├── shape-panel // 右侧面板 │ └── transformer-wrapper // 支持transformer高阶组件 ├── components │ ├── color-select // 颜色选择器 │ ├── context-menu / ...

腾讯网1 天

多重可控插帧视频生成编辑，Adobe这个大一统模型做到了，效果惊艳

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

腾讯网13 天

深度｜现代计算型强化学习之父：从瞬时到持续，迈向更好的深度学习

所谓的持续学习意味着你在任何时刻都在学习。每一刻都既是训练阶段，也是测试阶段。而传统的深度学习属于瞬时学习，因为它是在一个专门的训练阶段进行学习，随后在实际运行时就不再学习了。因此，将训练与测试分开，是一种非常不自然的做法。瞬时学习本身就是人为的设定 ...

2 天

高效学习泰语颜色词汇：技巧与策略

假设你在学习泰语颜色词汇时遇到了一些困难。你可以尝试以下方法：情景模拟：假设你在泰国市场购物，需要向摊主描述你想要的水果颜色。例如，你可以说：“ข้าวโพดสีเขียว (kʰâo pʰôd sī kʰiow)”（绿色的玉米）。

ZAKER on MSN8 天

电子红包封面送给你，赶快领取吧

01 2025年春节来临，又到了要给亲朋好友发红包的季节了。快来领取专属于新闻传播领域人员的电子红包封面吧。本期发送免费红包2000个，大家可以通过以下方式领取：领取方式一：点击下方图片领取 ...

虎嗅网2 天

DeepSeek狂飙13天：AI界开始真正严肃地思考未来

寻找梁文锋的人更是踏破铁鞋。外界对他的了解大多来自于2023年5月和2024年7月《暗涌》对他的专访。专访文章将他称为“一个更极致的中国技术理想主义者”。和OpenAI创始人山姆·阿尔特曼（Sam Altman） ...

3 天

狂飙13天：开源DeepSeek如何撼动全球AI市场

2025年1月中旬，英伟达CEO黄仁勋的中国之行备受瞩目。从北京到深圳，再到台中和上海，这位AI时代的“卖铲人”每到一处都掀起一阵热潮。然而，就在距离英伟达上海办公室仅200公里的杭州，一场足以撼动AI产业格局的风暴正在悄然酝酿。彼时，身家1200亿 ...

sinchew1 天

张晋玮.DeepSeek是创新还是抄袭？

从更宏观的角度来看，在中美人工智能博弈中，两国的相互制衡维持着一定的势力平衡，而对于小国如大马而言，这种竞争反而提供了更多选择空间，让小国能在不同阵营中各取所需，这未必是一件坏事。中国人工智能登上新闻头条！中企推出的DeepSeek ...

快科技18 天

北森控股宣布收购酷学院华兴资本担任酷学院独家财务顾问

北森此次收购是强化其市场领先地位、布局AI-Learning转型的重要战略举措；该交易同样是本年度中国SaaS行业首笔并购交易。据IDC的数据显示 ...

eeworld.com.cn4 天

DC2407A，基于 LT8650S 双通道 42V、4A 同步降压 Silent Switcher 2 的演示板

DC2407A 演示电路是一款双通道42V、4A 同步降压型 Silent Switcher，静态电流为 6.2uA，采用 LT8650S。 LT8650S 是第二代 Silent Switcher，可最大限度地降低 EMI 并降低 PCB 布局敏感性。该演示电路有两个输出：5V 和 3.3V。每个输出可同时提供高达 4A 的连续电流。传导 EMI 测量 ...

7 天

直接干穿美国科技股，DeepSeek这国产模型凭啥？

这么说吧，传统大模型训练里边，非常注重标注数据微调（ SFT ），也就是让大模型先按人类标注好的标准答案来学习，学着说人话；如果想要大模型性能强些，那还要再在 SFT 基础上加一些强化学习（ RL ），让大模型的理解能力更好。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果