Web3项目
EVMbench 发布后,Web3 团队该立刻改的不是模型,而是审计流程
EVMbench 发布后,Web3 团队该立刻改的不是模型,而是审计流程 先说结论 如果你在做链上产品,EVMbench 的真正信号不是“某个模型能打 70%”,而是智能合约审计已经进入“人机协作重排期”阶段:先用 Agent 做高覆盖扫描,再把人类审计时间集中在高风险逻辑与经济攻击路径上。这个顺序不改,团队会在下一轮安全竞争里掉队。 这件事的核心问题 过去我们把 AI 当“写代码加速器”,现在它开始变成“攻防能力放大器”。OpenAI 与 Paradigm 联合发布 EVMbench,把能力拆成 Detect / Patch / Exploit 三个模式,并且用本地链上可复现实验去评分。 本质变化是:安全评估不再只看“能不能发现 bug”,而是看能不能端到端完成利用、修复、再验证。这直接影响 Web3 团队的上线节奏和风险预算。 关键机制拆解 1)