数据不会撒谎,在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认最难的编程榜单中,GLM-5 分别拿下了 77.8 和 56.2 的高分,在真实编程场景的体感上,已经无限逼近 Claude Opus 4.5 ...
7 小时on MSN
GLM-5实力出圈:24小时不间断跑代码,从模拟器到3D游戏全拿捏
开源AI领域迎来重大突破,国产大模型GLM-5凭借其长任务处理能力引发全球开发者热议。这款模型不仅实现了连续24小时自主编写代码的壮举,更在无网络搜索、无并行计算、无参考代码的极端条件下,成功用Javascript开发出功能完整的Game Boy ...
Claude ...
智谱拉升大涨,半日收涨近18%,报239港元。消息面上,2月6日,全球模型服务平台OpenRouter悄然上线一款代号为“Pony Alpha”的匿名模型,因其强大的编码能力、超长上下文窗口及针对智能体工作流的深度优化,迅速引发开发者社区关注。知名X博主karminski-牙医猜测,Pony ...
这两天,一款名为Pony Alpha的模型,凭借在Coding能力上的出色表现,一时间成为了AI圈内最火爆的名字。 OpenRouter上并未标注Pony ...
🚀Vite+Vue3+Gin拥有AI辅助的基础开发平台,企业级业务AI+开发解决方案,内置mcp辅助服务,内置skills管理,支持TS和JS混用。它集成了JWT鉴权、权限管理、动态路由、显隐可控组件、分页封装、多点登录拦截、资源权限、上传下载、代码生成器、表单生成器和可 ...
吴咏炜:首先,我们来探讨一下现代代码与遗留系统的安全性问题。你在本次大会演讲中提到了一个耐人寻味的趋势:大多数内存安全漏洞源于新编写的代码,而不是遗留系统。 你认为这是什么原因造成的?是因为语言固有的复杂性、对现代特性的误用、开发者经验不足,还是工程流程和工具链存在缺口?
Anthropic 近期正式推送 Claude Opus 4.6 版本,此次更新堪称“Agent 能力跃迁”——不仅实现模型核心指标全面飙升,上下文窗口直接翻五倍至 1M Token,更给 Claude Code 新增 agent-teams 协作功能,彻底打破此前 AI 并行处理的局限。但Claude官方服务存在区域访问限制,且官方API接口也存在解析适配问题,而一步API 作为企业级AI解决方 ...
几周前,开源社区曾流传一个名为Pony Alpha的模型。它能进行长程交互、拆解复杂任务、在多轮对话中保持稳定上下文,一度引发广泛猜测。如今答案揭晓,Pony Alpha正是GLM-5的匿名测试版本。
智通财经APP获悉,2月9日,智谱(02513)拉升大涨,截至发稿,盘中最大涨幅超40%,报287.8港元。消息面上,2月6日,全球模型服务平台OpenRouter上线搜索排名第一的神秘匿名模型,代号为“Pony Alpha”,因其强大的编码能力及针对智能体工作流的深度优化,迅速引发开发者社区关注,爆火海外社区。 据多位知名科技博士及硅谷科技企业家预测,这款模型或为DeepSeek-V4、或为智谱 ...
3 天on MSN
神秘国产模型Pony Alpha现身海外,编程与智能体能力引发行业新期待
一款名为“Pony ...
2月9日,“全球大模型第一股”智谱股价盘中飙涨超40%,最终以276.8港元/股收盘,暴涨36.22%,最新市值为1234亿港元,创上市以来新高。 2月6日,全球模型服务平台OpenRouter上线了代号为“Pony ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果