Llama 7B - 搜索 News

2 天

在预训练阶段，OLMo 2通过多种技术改进了训练稳定性，例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增，从而提高了最终模型的性能。

17 天

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

360 智脑早在 2023 年就开始了长文本大模型的研发，到目前为止已经成功应用于开源并更新了两个版本的 360Zhinao-7B-Chat-360k 模型，以及近日发布的长思维链推理模型 360gpt2-o1。在 360-LLaMA-Factory 中，我们将 360 智脑内部长序列后训练能力系统性地整合进了 LLaMA-Factory ...

18 天

清华团队依靠强化学习成功打造超越GPT-4o的7B模型Eurus-2-7B-PRIME

近日，清华大学自然语言处理（NLP）实验室联合上海AILab和清华大学电子系，以及OpenBMB社区，成功提出了一种新的强化学习方法——PRIME（Process Reinforcement through Implicit ...

来自MSN5 个月

“AI界安卓”Llama ，不火了？

这远低于Llama 3 在4月发布后首月里的580万次下载量。相比之下，Mistral公司最小的开源模型Mistral-7B的新版本在上个月的下载次数，比Llama 3还要多。

来自MSN2 个月

端侧小模型新星，SmolLM2 1.7B击败了Llama 3.2、Qwen 2.5

端侧小型语言模型新星——SmolLM2 1.7B击败了Qwen 2.5 1.5B和Llama 3.2 1B： Apache 2.0许可训练于11万亿个令牌在FineWeb-Edu、DCLM、The Stack以及新的数学和编码 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果