词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 能力 | 内置记忆 | Honcho |
|---|---|---|
| 跨会话持久化 | ✔ 基于文件的 MEMORY.md/USER.md | ✔ 服务端 API |
| 用户画像 | ✔ 手动 agent 维护 | ✔ 自动辩证推理 |
| 会话摘要 | — | ✔ 会话级上下文注入 |
| 多 agent 隔离 | — | ✔ 按 peer 分离画像 |
| 观察模式 | — | ✔ 统一或定向观察 |
| 结论(派生洞察) | — | ✔ 服务端模式推理 |
| 历史搜索 | ✔ FTS5 会话搜索 | ✔ 基于结论的语义搜索 |
dialecticCadence 控制频率),Honcho 分析交流内容,推导出关于用户偏好、习惯和目标的洞察。这些洞察随时间积累,使 agent 对用户的理解不断加深,超越用户明确表述的内容。辩证过程支持多轮深度(1–3 轮),并自动选择冷启动/热启动 prompt——冷启动查询聚焦于通用用户事实,热启 动查询优先处理会话级上下文。hybrid 或 context 模式下),Honcho 组装两层上下文注入到系统 prompt 中:contextCadence 刷新。这是"这个用户是谁"层。dialecticCadence 刷新。这是"当前最重要的是什么"层。contextTokens 预算截断(如已设置)。| 旋钮 | 控制内容 | 默认值 |
|---|---|---|
contextCadence | context() API 调用之间的最小轮数(基础层刷新) | 1 |
dialecticCadence | peer.chat() LLM 调用之间的最小轮数(辩证层刷新) | 2(推荐 1–5) |
dialecticDepth | 每次辩证调用的 .chat() 轮数(1–3) | 1 |
contextCadence: 1, dialecticCadence: 5, dialecticDepth: 2 表 示每轮刷新基础上下文,每 5 轮运行一次辩证,每次辩证运行 2 轮。dialecticDepth > 1 时,每次辩证调用运行多轮 .chat():dialecticDepthLevels 可逐轮覆盖——例如,深度 3 运行时使用 ["minimal", "medium", "high"]。dialecticDepth 触发一次辩证调用,并将结果直接传递给第 1 轮的上下文组装。对冷 peer 进行单轮预热通常返回较少内容——多轮深度会在用户开口之前完成审计/调和周期。如果预热在第 1 轮前未完成,第 1 轮将回退到有超时限制的同步调用。dialecticReasoningLevel:≥120 字符时 +1 级,≥400 字符时 +2 级,上限为 reasoningLevelCap(默认 "high")。设置 reasoningHeuristic: false 可禁用此功能,将所有自动调用固定在 dialecticReasoningLevel。可用级别:minimal、low、medium、high、max。~/.honcho/config.json(全局)或 $HERMES_HOME/honcho.json(profile 本地)中配置。设置向导会自动处理。| 键 | 默认值 | 说明 |
|---|---|---|
contextTokens | null(不限制) | 每轮自动注入上下文的 token 预算。设为整数 (如 1200)以限制上限,按词边界截断 |
contextCadence | 1 | context() API 调用之间的最小轮数(基础层刷新) |
dialecticCadence | 2 | peer.chat() LLM 调用之间的最小轮数(辩证层)。推荐 1–5。在 tools 模式下无关——由模型显式调用 |
dialecticDepth | 1 | 每次辩证调用的 .chat() 轮数,限制在 1–3 |
dialecticDepthLevels | null | 可选的每轮推理级别数组,如 ["minimal", "low", "medium"],覆盖按比例分配的默认值 |
dialecticReasoningLevel | 'low' | 基础推理级别:minimal、low、medium、high、max |
dialecticDynamic | true | 为 true 时,模型可通过 tool 参数逐次覆盖推理级别 |
dialecticMaxChars | 600 | 注入系统 prompt 的辩证结果最大字符数 |
recallMode | 'hybrid' | hybrid(自动注入 + tools)、context(仅注入)、tools(仅 tools) |
writeFrequency | 'async' | 消息刷新时机:async(后台线程)、turn(同步)、session(会话结束时批量)或整数 N |
saveMessages | true | 是否将消息持久化到 Honcho API |
observationMode | 'directional' | directional(全部开启)或 unified(共享池)。可用 observation 对象进行精细控制 |
messageMaxChars | 25000 | 通过 add_messages() 发送的每条消息最大字符数,超出时分块 |
dialecticMaxInputChars | 10000 | 传入 peer.chat() 的辩证查询输入最大字符数 |
sessionStrategy | 'per-directory' | per-directory、per-repo、per-session 或 global |
per-session — 每次 hermes 运行获得一个新会话。干净启动,通过 tools 访问记忆。推荐新用户使用。per-directory — 每个工作目录对应一个 Honcho 会话,上下文跨运行积累。per-repo — 每个 git 仓库对应一个会话。global — 所有目录共用一个会话。hybrid — 上下文自动注入系统 prompt,同时提供 tools(由模型决定何时查询)。context — 仅自动注入,隐藏 tools。tools — 仅 tools,不自动注入。agent 必须显式调用 honcho_reasoning、honcho_search 等。| 设置 | hybrid | context | tools |
|---|---|---|---|
writeFrequency | 刷新消息 | 刷新消息 | 刷新消息 |
contextCadence | 控制基础上下文刷新 | 控制基础上下文刷新 | 无关——不注入 |
dialecticCadence | 控制自动 LLM 调用 | 控制自动 LLM 调用 | 无关——由模型显式调用 |
dialecticDepth | 每次调用的多轮数 | 每次调用的多轮数 | 无关——由模型显式调用 |
contextTokens | 限制注入量 | 限制注入量 | 无关——不注入 |
dialecticDynamic | 控制模型覆盖 | 不适用(无 tools) | 控制模型覆盖 |
tools 模式下,模型完全自主——它在需要时调用 honcho_reasoning,并自行选择 reasoning_level。Cadence 和预算设置仅适用于有自动注入的模式(hybrid 和 context)。SessionPeerConfig 一一对应:| 开关 | 效果 |
|---|---|
observeMe | Honcho 根据该 peer 自身的消息构建其表 示 |
observeOthers | 该 peer 观察另一 peer 的消息(用于跨 peer 推理) |
observationMode 是快捷预设:| 预设 | 用户标志 | AI 标志 | 语义 |
|---|---|---|---|
"directional"(默认) | me: 开,others: 开 | me: 开,others: 开 | 完全互相观察。启用跨 peer 辩证——"AI 根据用户所说和 AI 回复,对用户了解多少。" |
"unified" | me: 开,others: 关 | me: 关,others: 开 | 共享池语义——AI 仅观察用户消息,用户 peer 仅自我建模。单观察者池。 |
observation 块覆盖预设,实现逐 peer 精细控制:"observation": {
"user": { "observeMe": true, "observeOthers": true },
"ai": { "observeMe": true, "observeOthers": false }
}| 意图 | 配置 |
|---|---|
| 完全观察(大多数用户) | "observationMode": "directional" |
| AI 不应根据自身回复重新建模用户 | "ai": {"observeMe": true, "observeOthers": false} |
| AI peer 不应通过自我观察更新的强人设 | "ai": {"observeMe": false, "observeOthers": true} |
| Tool | 用途 |
|---|---|
honcho_profile | 读取或更新 peer 卡片——传入 card(事实列表)以更新,省略则读取 |
honcho_search | 对上下文进行语义搜索——返回原始摘录,不经 LLM 合成 |
honcho_context | 完整会话上下文——摘要、表示、卡片、近期消息 |
honcho_reasoning | Honcho LLM 合成的答案——传入 reasoning_level(minimal/low/medium/high/max)控制深度 |
honcho_conclude | 创建或删除结论——传入 conclusion 创建,传入 delete_id 删除(仅限 PII) |
hermes honcho 子命令仅在 Honcho 为当前活跃 memory provider 时注册(config.yaml 中 memory.provider: honcho)。先运行 hermes memory setup 并选择 Honcho,子命令将在下次调用时出现。hermes honcho 迁移hermes honcho setup:honcho.json 或 ~/.honcho/config.json)已保留memory.provider: honcho 即可重新激活hermes memory setup 并选择"honcho"——向导会自动检测你的现有配置。