|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
作者:微信文章
基础模型 2025年6月,国内方面,AI头部大公司在基模开源上有大动作:
华为首次开源盘古大模型系列(7B稠密参数和72B MoE结构的混合专家模型);百度开源文心4.5系列模型全家桶,包括: 纯文本大模型和文本视觉VL多模态大模型,参数量覆盖0.3B/A3B/A47B等不同需求使用场景;腾讯持续开源混元语言大模型:7B稠密参数模型和激活参数量为13B的MoE混合专家模型。阿里Qwen团队开源了基于Qwen3的文本Embedding和Reranking两个任务下的多个尺寸的模型:0.6B/4B/8B。
至此,国内头部AI公司中只剩字节的豆包基座模型权重仍未开放。目前,开源模型中,阿里Qwen凭借先发优势,在应用市场中仍存在显著的领先优势,持续关注国内几个大公司开源后的模型使用格局。模型类型 | 模型 | Huggingface下载量
最近一个月(截止2025.7.6 ) | LLM | Qwen/Qwen2-7B-Instruct | 14,515,118 | deepseek-ai/DeepSeek-R1 | 689,504 | tencent/Hunyuan-A13B-Instruct | 13,699 | baidu/ERNIE-4.5-300B-A47B-Paddle | 5,179 | baidu/ERNIE-4.5-21B-A3B-PT | 2,812 | VL | Qwen/Qwen2.5-VL-7B-Instruct | 3,759,411 | baidu/ERNIE-4.5-VL-424B-A47B-PT | 5,877 |
|
|