您好,欢迎访问2026FIFA世界杯下单平台官网!

世界杯下单平台 若何构建卓著99%东说念主的Harness Engineer

来源:2026FIFA世界杯下单平台官网 浏览次数:169

自2026岁首以来,对于AI编码的讨论缓缓发生变化。

畴昔的重心是使用哪个模子、编写什么教导词以及高下文不错多长。天然,这些事情仍然很蹙迫。

有关词,从主要参与者的实践中不错了了地看出,仅靠这些无法惩处耐久、高质地和抓续运行的问题。

豪放六个月前,我仅使用Claude.md运行一个花式。

若是你写下编码商定、目次结构和本领栈,AI频繁会按预期责任。至少在一运行是这么。

问题在花式变大后运行出现。

质地各异:即使使用疏浚的指示"添加API端点",文献搁置和空幻处理细节也可能因会话而异。

会话断开:当你要求他们连接昨天的责任时,你得到的完结忽略了以前的狡计决策。

手段添加失败:在添加了20多个手段(如/write-test)后,管理引申端正和先决条目变得难以管理。

换句话说,Claude的markdown只不外是一个"苦求"。

莫得机制来检测违法。

莫得机制来闪耀章程何时变得过期。

若是你录用给他们一个耐久任务,一个空幻心味着他们将不得不从新运行。

这里的问题不单是是教导词的编写方式。

内容上,这源于AI智能体运行的环境莫得被正确狡计这一事实。

因此,自2026岁首以来引起暖热的一个成见是Harness Engineering。

Harness Engineering是什么?

什么是harness?

Harness是一匹赶紧衣裳的"马具",由缰绳、马鞍和笼头构成——一套完竣的器具,用于指引一匹巨大但不行展望的动物朝着正确的方上前进。

Harness Engineering是什么?

Harness Engineering是对于狡计允许AI智能体相识、自主运行的"环境自己"。

开云体育app2026世界杯中国官方下载

就像你用马具舍弃马一样,思法是舍弃AI并指引它朝着正确的方上前进!

• AI模子就像马。它们很巨大,但不知说念我方要去那儿。

• Harness是一套缰绳、马鞍和笼头。它代表指引AI朝着正确方上前进的环境、管制和器具的总额。

字据Michael Hashimoto的说法,主张是"创建一个堤防AI智能体失败再次发生的环境"。

我不知说念现时是否有平素的行业公认术语,但我仍是运行称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时分狡计一个惩处决策,使智能体耐久不会再犯相同的空幻。

进化的真正体验:

AI智能体舍弃仍是经验了三个阶段。

咱们将归来每个阶段变得可能的事情和穷乏的东西。

第一阶段:CLAUDE.md时期(教导词工程,2023岁首)

在花式根目次搁置一个CLAUDE.md文献,并在其中写入你的本领栈和编码商定。仅此一项就权贵改善了AI的输出。

CLAUDE.md

本领栈

• Next.js 15(App Router)

• TypeScript 5.x

• Prisma + PostgreSQL

商定

• 组件必须放在src/components/中

• API路由必须放在src/app/api/中

• 类型界说必须都集在src/types/中

当今不错作念什么:AI了解本领栈并生成适合商定的代码。

穷乏什么:章程只是"苦求"。会话扫尾时先前的高下文丢失了。当多东说念主开荒时,Claude.md的证明因智能体而异。

第二阶段:AGENTS.md时期(高下文工程)

CLAUDE.md变得太大,世界杯下单平台无法在单个文献中管理。这导致引入了永别章程的设立.claude/rules/。

AGENTS.md看成跨器具的怒放范例开荒,是一种声明性形色智能体指示(读取哪些文献、使用哪些器具等)的机制。

其性情是不依赖于任何特定器具,不错被Claude Code除外的智能体器具援用。

project/

├── CLAUDE.md # 花式范围的计谋(保抓简略)

├── AGENTS.md # 智能体指示(跨器具范例)

└── .claude/

└── rules/

├── architecture.md # 架构管制

├── testing.md # 测试计谋

└── security.md # 安全要求

当今不错作念什么:章程的暖热门永别。咱们不错将智能体援用的高下文中的信息量舍弃在最低必要水平。AGENTS.md允许咱们不管使用什么器具都能范例化对智能体的指示。

穷乏什么:即使章程被写下来,也莫得办法强制引申它们。会话之间的顾虑丢失问题仍然莫得惩处。手段引申程序留给智能体,导致质地不一致。

第三阶段:Harness Engineering(2025年底于今)

意志到只是界说章程是不够的,咱们集成了引申、考据和顾虑机制。这等于harness。

Harness不取代高下文工程;它包含高下文工程。

CLAUDE.md和AGENTS.md都是harness的一部分。harness开荒在这些层之上:手段、钩子、顾虑和考据轮回。

若是不将这三个成见视为对立的思法,而是看成闪耀力焦点的改变,就更容易解析它们。

Harness之前和之后

这闪现了引申疏浚任务"添加用户身份考据API"时有无harness的区别。

之前:仅CLAUDE.md

指示:"完结用户身份考据API"

罢了:

• 在src/app/api/auth/route.ts中完结了JWT身份考据 ← 正常

• 以明文纪录密码 ← 安全违法

• 空幻响应形势与现存API不一致 ← 商定违法

• 未包含测试 ← 未达到范例

• 忽略了先前决定使用NextAuth.js进行身份考据的计谋 ← 高下文链接性丢失

在五个托福恶果中,唯有一个莫得问题。

即便如斯,问题也只是在东说念主工审查时才被发现。

指示:"完结用户身份考据API"

引申的舍弃:

[顾虑] 从progress.md读取先前的决策 → 阐明聘用了NextAuth.js

[手段] 除名/add-feature责任流,按以下端正完结:类型界说 → 逻辑 → API → 测试

[钩子] 文献保存时自动使用Biome形势化代码

[钩子] 立即检测console.log语句和安全违范围式

[反馈] 任务完成前运行类型查验 + 测试 → 0个类型空幻,总共测试通过

[顾虑] 更新progress.md用于下次会话

罢了:

使用NextAuth.js完结(反馈先前的决策) ← 正常

适合安全要求 ← 正常

长入空幻响应形势 ← 正常

达到测试诡秘率范例 ← 正常

更新程度文献 ← 正常

区别很彰着。莫得harness,操作是"但愿获取好的输出"。有了harness,结构被狡计为"堤防差的输出"。

论断

Harness Engineering是为灵验使用AI智能体而狡计环境。

诚然教导词工程是"若何建议苦求"的艺术,但harness工程是"若何使其责任"的艺术。

在践诺行使中,后者的蹙迫性正在稳步增多。

• 章程由机器强制引申,而不是通过苦求。

• 顾虑应该外部化而不是存储在AI中。

• 狡计时应假定不错还原,而不是假定不会失败。

• 主张是创建团队不错重用的结构,而不是依赖个东说念主的明智灵敏。

在AI智能体时期,所需的可能

不是编写更长的教导词,而是

创建更好的harness。

暖热 AI拉呱

若是这篇内容对你有启发,迎接暖热「AI拉呱」,获取更多 AI 前沿瞻念察、实战教程与趋势解读。

下期在看

下期将连接带来该主题的进阶拆解与实操案例世界杯下单平台,建议先保藏本文,幸免错过更新。

联系我们

电话:

邮箱:比赛直播

地址: