Gargantua's Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
    个人简介 流光札记
  • 友链
首页
归档
分类
标签
关于
个人简介
流光札记
友链
搜索
关灯

Gargantua'Blog

如何用 inspect-ai 搭建 Agent 安全评测框架:设计测试链路及数据集

为什么开始使用 inspect-ai?最近在做一些 Agent 安全测试相关的事情,业务需求是某垂类领域的一款 Agent 需要做安全防护,需要从攻击到测试到加固整链路打通,在产品上线之前保证 Agent 具备一定程度的安全防护能力。 由于这个 Agent 目前是完全为了赶功能出来的半成品,所以在我拿到测试网页的时候不到半个小时就成功找出了稳定调用 ‘python’ 执行工具的方法,后续一系列服务
2026-04-12
#工具分享

Harness 设计:面向长时应用开发的生成-评估闭环

Harness  这词刚出现我是有点懵的,一度以为 A÷ 又在搞什么“颠覆”的新技术了,然后去读了一遍他们新发的文章Link ,其实感觉和 25 年比较容易水的多智能体系统 (Multi-Agent-Systems, MAS) 某些地方有点类似,这里做个简单记录,说不定我们 MAS 又能复活了哪? 为什么直观的方法总会失败上下文窗口增长导致不连贯长时间执行会持续累积对话与中间产物。随着上下文接近上
2026-04-08
#Agent 设计

搜索

© 2026 catdfd.com
总访问量 次 总访客数 人