新智元报道 编辑:peter东 乔杨【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo ...
这远低于Llama 3 在4月发布后首月里的580万次下载量。 相比之下,Mistral公司最小的开源模型Mistral-7B的新版本在上个月的下载次数,比Llama 3还要多。
端侧小型语言模型新星——SmolLM2 1.7B击败了Qwen 2.5 1.5B和Llama 3.2 1B: Apache 2.0许可 训练于11万亿个令牌 在FineWeb-Edu、DCLM、The Stack以及新的数学和编码 ...