多模态大模型在代码能力上进步惊人,但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架 ——SWE-Vision,让模型可以编写并执行 Python ...
计算机工程师和程序员长期以来依赖逆向工程来实现程序功能,而不直接复制受版权保护的原始代码。简单来说,就是在不侵犯版权的前提下“模仿”软件的行为和功能。过去,这种做法通常遵循所谓的“洁净房间(clean room)”原则:由完全不接触原始代码的人重新实现功能,以确保生成的新代码不会构成原作的衍生作品。
终于,“养虾人”们也有自己的专属模型了。 就在今天,智谱稍早前开始内测的神秘模型Pony-Alpha-2终于揭开了真实身份——全球首个“龙虾特供”模型GLM-5-Turbo。
多模态大模型在代码能力上进步惊人,但在基础视觉任务上却频繁失误。 活跃在AGI基础研究前沿的技术团队UniPat AI构建了一个极简的视觉智能体框架——SWE-Vision,让模型可以编写并执行Python代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中,SWE-Vision均达到了当前最优水平。 模型看得见,却没法精确处理 多模态大模型的代码能力在过去一年取得了惊人进展——独立搭建项目、 ...
3月16日消息,小米AI实验室研究员罗福莉,也就是很多人口中的“天才少女”,又发论文了。论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。如果只看标题,这篇论文似乎只是一个偏工程的研究:如何让AI ...
AI 时代大学生创业*的机遇在于资源平权。一个人也能借助 AI 快速做出 MVP、快速迭代、快速触达全球用户。真正稀缺的品质不是「会用 AI」,而是能定义真实问题,并持续把技术变成可交付的产品价值。
你有没有讲过“不合适”的笑话,买过“不合适”的拖地长裤。当你把本该属于「这样」的东西强行用来「那样」,这种unsuitable就会带来别样的幽默和潮流。我们正处在一个万物皆可错位的时代:最顶尖的AI算力不去计算宇宙大爆炸,而是盯着你的尿频以便翻桌;想 ...
GUI 赢了上一个十年,但它的时代快到头了。 CLI 正在赢下一个十年,只不过这次,CLI 的用户不再是开发者,而是 Agent。 这个判断听起来有点反直觉,毕竟 CLI 是计算机世界里最古老的交互方式之一了。但回头看这半年的趋势,Claude Code 是 CLI,Codex 是 CLI,OpenClaw 也是 CLI。 Agent 操控计算机的方式,正在从「看屏幕点鼠标」转向「读文档敲命令」。
IT之家3 月 10 日消息,腾讯云大模型 Coding Plan 订阅服务现已全面上新,支持 Tencent HY 2.0 Instruct、GLM-5、Kimi-K2.5、MiniMax-M2.5 等主流大模型,更多模型还在持续接入中。 IT之家在此援引官方公众号消息,Coding Plan 首发支持使用 CodeBuddy、OpenClaw、Claude Code、Cline、Cursor ...
项目维护者 Dan Blanchard 为让 chardet 项目加入 Python 标准库,利用 AI 编程工具 Claude Code,在短短 5 天内彻底重写了该项目,并推出了 7.0 版本。 新版本不仅在性能方面最高可提升 48 倍, Blanchard 还借此将项目原本严格限制复用与分发的 LGPL 协议,更改为了允许在闭源商业项目中使用的宽松 MIT 协议。