带多模态的 Agent 模子,真就了不得。
一句话,十几分钟,仿写一个网页版 MacOS 界面。

每个运用皆能点进去,终局输入高歌还能复返成果我是最信服的。

这等于阿里上新的 Qwen-3.7 Plus,多模态交互式羼杂 Agent。

Qwen3.7-Plus 把视觉和道话才调放进消除个底座,同期保留代码、用具使用。这些智能体才调。
它能感知现实场景,读屏并操作 GUI,从视觉参考里写代码,端到端导航 App,还能麇集网页学问修起视觉问题。
往日许多模子擅长单点才调,看图归看图,写代码归写代码,浏览网页归浏览网页。
Qwen3.7-Plus 想把它们放进消除个轮回。
这亦然" Hybrid "(羼杂)的含义。
官方展示里,最凸起的是一个长程 App 研发任务。
团队基于 Qwen3.7 构建的 Hybrid-Agent 系统,连络踏实脱手跨越 11 小时,自动完成一个英语词汇学习 App 的无缺研发周期。
秘密需求文档生成、自动编码、装配部署、测试用例创建、GUI 自动化测试、多场景并行测试、居品文档更新,以及自主版块演进。
10000+ 行代码,1000+ 次 Agent 调用。
开运体育中国官网入口另一个桌面运用建造案例是复刻了原生 macOS Stocks App。
智能体先和原生运用交互,相识 UI 布局和功能细节,再生成 SwiftUI 源码,接入真践诺情 API,自动编译并启动复刻运用。
它还作念了 10 项功能考据,包括及时行情加载、股票接纳和切换、多周期视图切换、搜索过滤、防护统计面板展示等。
这 10 项皆通过了。
Qwen3.7-Plus 的基准测试环境成就有防护浮现:
Terminal Bench 2.0 使用 Harbor/Terminus-2 harness,百家乐正规平台官方版5 小时超时,12 核 CPU/24GB 内存,温度 1.0,最大 token 数 80K,陡立文 256K,取 5 次脱手均值,每轮开首预置一个 think token 让模子自行决定是否启动深度想考;
Kernel Bench L3 每个测试样本在孤苦 Docker 容器中脱手,配备一块 H100 80GB GPU,收尾 500 次用具调用,连络 100 轮无纠正则提前住手,并使用 GPT-5.4 检测潜在的舞弊活动。
成果若何?
代码任务,各家模子发扬也曾十分接近,唯有长程代码任务还能拉开少许差距。
通用智能体任务,Qwen 3.7 Plus 基本也在第一梯队。
到了多模态任务,等于 Qwen 3.7 Plus 的缔结了。

Qwen3.7-Plus 提供 API 调用,撑握文本和图像 / 视频羼杂输入,并提供" preserve_thinking "功能,
在多轮对话的讯息中保留每一轮的想考执行,官方保举在智能体任务中开启此功能。
模子兼容 OpenAI 标准的 chat completions 和 responses API。
在跨框架泛化方面,Qwen3.7-Plus 在 Claude Code、OpenClaw、Qwen Code 等不同 Agent 框架中均能踏实脱手,无需为特定框架作念适配。
不外如故有多数建造者但愿能延续像 Qwen 之前的模子相同绽放权重,在土产货部署。

— 接待 AI 居品从业者共建 —
� �「AI 居品学问库」是量子位智库基于遥远居品库跟踪和用户活动数据推出的飞书学问库,旨在成为 AI 行业从业者、投资者、商议者的中枢信息要道与方案撑握平台。

一键珍视 � � 点亮星标
科技前沿进展逐日见百家乐正规平台官方版
