
2月16日除夜本日,阿里巴巴开源全新一代大模子千问Qwen3.5-Plus,性能失色Gemini 3 Pro,登顶民众最强开源模子。
据悉,千问3.5达成了底层模子架构的全面改良,这次发布的Qwen3.5-Plus版块总参数为3970亿,激活仅170亿,以小胜大,性能逾越万亿参数的Qwen3-Max模子,部署显存占用镌汰60%,推理成果大幅培植,最大推理糊涂量可培植至19倍。Qwen3.5-Plus的API价钱每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。
与前几代的千问谎话语模子不同,千问3.5达成了从纯文本模子到原生多模态模子的代际跃迁。千问3预历练在纯文本Tokens上进行,而千问3.5则基于视觉和文本搀杂token上预历练,并大幅新增中英文、多话语、STEM和推理等数据,让伸开“眼睛”的大模子学会了更密集的宇宙学问和推理逻辑,以不到40%的参数目取得超万亿的Qwen3-Max基座模子的顶尖性能,在推理、编程、Agent智能体等全主义基准评估中均进展优异。比如,千问3.5在MMLU-Pro学问推理评测中得分87.8分,越过GPT-5.2;在博士级贫困GPQA测评中斩获88.4分,高于Claude 4.5;在提醒谨守IFBench以76.5分刷新系数模子记录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5进展均越过Gemini 3 Pro、GPT-5.2。
原生多模态历练,也带来千问3.5的视觉才能飞跃:在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文献相识(CC_OCR)、空间智能(RefCOCO-avg)、视频相识(MLVU)等广博巨擘评测中,千问3.5均斩获最好性能。在学科解题、任务筹备与物理空间推理等任务上,千问3.5比较千问专项模子Qwen3-VL进展更好,空间定位推理和带图推理才能均大幅增强,推理分析更精致、精确;在视频相识方面,千问3.5营救长达2小时(1M token高下文)的视频径直输入,适用于长视频本色分析与摘记生成;同期,千问3.5达成了视觉相识与代码才能的原生交融,聚集图搜和生图用具,可将手绘界面草图径直转为可用的前端代码,一张截图就能定位并斥地UI问题,让视觉编程实在成为出产力用具。
千问3.5的原生多模态历练,是在阿里云AI基础法子上高效完成的。通过系列基础时代翻新,千问3.5在文本、图像、视频等搀杂数据历练糊涂量,几近100%握平纯文本基座模子历练,大举镌汰了原生多模态历练的难度门槛;同期,通过打算小巧的FP8、FP32精度哄骗计谋,在历练逍遥膨大到数十万亿个token时,激活内存减少约50% ,历练还能提速10% ,进一步简陋了模子历练资本、培植了历练就果。
千问3.5也达成了从Agent框架到Agent哄骗的新冲突。千问3.5可自主操作手机与电脑,高效完成平常任务,在挪动端营救更多主流APP与提醒,在PC端可处罚更复杂的多智商操作,如跨哄骗数据整理、自动化经由实行等,显贵培植操作成果。同期,千问团队构建了一个可膨大的Agent异步强化学习框架,端到端可加快3到5倍,并将插件式智能体Agent营救膨大至百万级范围。
据悉,千问APP、PC端已第一时分接入Qwen3.5-Plus模子。开发者可在魔搭社区和HuggingFace下载新模子,或通过阿里云百真金不怕火径直获取API劳动。阿里很快将链接开源不同尺寸、不同功能的千问3.5系列模子。性能更强的旗舰模子Qwen3.5-Max不久也将发布。

