此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其实我也不想这么早起床写知乎的,今天早上一大早被吵醒,本来想多睡会,只因随手刷了朋友圈,被Qwen3发布的消息刷屏了。于是我马上坐起来,看了下官方报告,然后下载各种尺寸模型的权重(各种下载,耗费了我几百G硬盘空间)。在开始讲部署前以及测试结果之前,先给读者大概介绍下Qwen3吧。
关注时代Java