Seeing like an Agent:大模型工具的设计指南
“One of the hardest parts of building an agent harness is constructing its action space.” 构建 Agent 框架最难的部分之一,是设计它的动作空间。 —— Anthropic, Lessons from Building Claude Code: Seeing like an Agent “C...
“One of the hardest parts of building an agent harness is constructing its action space.” 构建 Agent 框架最难的部分之一,是设计它的动作空间。 —— Anthropic, Lessons from Building Claude Code: Seeing like an Agent “C...
MCP 工具设计中的克制、约束与 Agent 思维 0. 写在前面 这篇文章不是教程,是一组设计原则。 如果你正在构建 MCP server,或者正在考虑构建一个,我想分享一个核心认知:给 AI Agent 设计工具和给人设计 API 是两件完全不同的事。传统 API 设计追求完整性和灵活性;Agent 工具设计追求克制和约束。 这些原则不是我凭空发明的。Anthropic 在 B...
MCP(Model Context Protocol)是当下 AI 工具链的热门话题。当 unidbg 社区引入 MCP 功能后,不少人觉得这是个好方向——让 AI 直接操作调试器,下断点、读内存、单步执行,听起来很美好。 事实上,在 unidbg 官方加入 MCP 之前,笔者就已经尝试过给 unidbg 做 MCP 接入。结果发现问题比想象中多得多,最终放弃了这条路线,转而采用 Clau...
本文仅供安全研究和学习交流,请勿用于非法用途。 VMP(Virtual Machine Protection)是当前移动端 SO 保护的主流方案。核心思路是将关键算法编译为自定义字节码,由嵌入 SO 中的解释器运行时执行。传统静态分析在这种保护下几乎失效——你看到的不是算法本身,而是一个通用解释器在逐条执行你看不懂的字节码。 本文分享一套 AI 辅助的 VMP 逆向方法论。不针对任何具...
本文仅供安全研究和学习交流,请勿用于非法用途。 一、背景 1.1 华为云5s盾是什么 访问某些政府/企业网站时,会弹出”请稍候…正在验证您是否是真人”的5秒等待页面,这就是华为云的 WAF 产品 CT2-WAAP。 服务端返回 412 Precondition Failed,页面加载两个JS:一个动态配置脚本(每次不同),一个约565KB的静态bundle。JS自动完成验证后设置co...
本文仅供安全研究和学习交流,请勿用于非法用途。 一、背景与目标 1.1 腾讯防水墙(TCaptcha)简介 腾讯自研验证码服务,广泛用于 QQ、微信生态及第三方接入 本文目标:小黑盒登录页的文字点选验证码(”请依次点击:X X X”) 1.2 为什么难 核心加密逻辑运行在 CHAOS VM 中——一个自定义栈式字节码虚拟机 tdc.js 每次加载动态变化:模块 ...
一、前言 做过 Web 端和 App 端逆向的人都知道,Web 端的逆向分析工具可以说非常统一 —— Chrome 自带的 DevTools 就够了,既能抓包,又能调试,还能替换资源、进行 Trace。虽然谷歌未必是为了我们逆向分析才做得这么好,但毫无疑问,Web 端的逆向门槛确实低了很多。 对于 Web 端的逆向分析,之前我已经开发了基于 chrome-devtools-mcp 的 j...
本文仅供安全研究和学习交流,请勿用于非法用途。 前言 我一直使用 AI 辅助 JS 逆向分析。从简单的 OB 混淆、sojson,到单 VM 保护,AI 都能很好地完成任务。 但这次遇到了一个新挑战:多态虚拟机 (Polymorphic VM) 保护。 与单 VM 不同,多态 VM 有 30+ 个独立的 dispatcher,同一个 opcode 在不同 VM 中执行完全不同的操作...
背景:又一次被 AI 气到半死,我想跟大家聊聊使用 AI 的经验。 前言 为什么起这个标题呢?我从去年开始,至少已经半年时间,不再自己写任何代码,全部使用 AI 来编写代码。这其中踩了很多的坑,也因为相信 AI 多次不得不自己为 AI 擦屁股。 今天想跟大家聊聊,为什么尽管 AI 目前确实存在问题,但是我依然坚持完全使用 AI 编程,而非自己手动写代码,或者只是让 AI 帮我写代码。...