AI新闻资讯 2026-04-07 13:51:29
近期因

软件工程“准大神”: 在 SWE-Pro 基准测试中得分 56.22%,已接近顶尖模型 Opus 的水平。其在分析 Bug、代码安全及端到端项目交付(VIBE-Pro55.6%)方面表现优异。
Office 办公深度适配: 在 GDPval-AA 的 ELO 得分为 1495,位居开源模型前列。该模型显著提升了对 Excel、PPT、Word 的复杂编辑能力,长文本场景下的复杂技能遵循率高达 97%。
情商与身份保持: 除了生产力场景,

此前,针对 Anthropic 限制第三方接入 OpenClaw 等行为,
跨平台设计:
拒绝门槛: 官方认为过度限制会扼杀创新,开源后的
官方诚恳表示,由于此前低估了开源所需的基础设施适配工作量,导致进度稍有推迟。
更便宜的 Token: 随着开源版本的发布,更多平台将能直接运行
性能对标: 在
结语:国产大模型的“普惠时刻”
从2.5到2.7,