OpenSquilla – 开源的微内核 AI Agent 框架,可降低Token成本
OpenSquilla是什么
OpenSquilla是开源、可自托管的Token高效型微内核AI Agent运行时,主打”同样的预算,更高的智能密度”。采用极简微内核架构(核心仅约100行代码),通过本地ML模型路由、自适应推理深度、四层认知记忆系统和按需技能加载,可将Token成本降低60-80%。支持OpenAI、Anthropic、DeepSeek、Gemini等20+主流LLM提供商,内置分层安全沙箱、多通道统一网关(Web/Slack/飞书/钉钉等)及丰富工具集,并提供从OpenClaw和Hermes Agent的迁移工具。

OpenSquilla的主要功能
- SquillaRouter 智能路由:本地LightGBM + ONNX分类器,综合消息长度、语言、代码块、关键词和语义嵌入评分,将任务自动路由到T0-T3四个层级的最便宜可用模型,分类过程完全在设备本地完成。
- 自适应推理深度:仅对复杂查询启用深度推理,简单问题不消耗推理Token;系统Prompt根据任务复杂度自动缩放,避免过度消耗。
- 多LLM提供商统一接入:支持OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等20+提供商,支持主模型+备用模型自动切换。
- 四层认知记忆架构:工作记忆、情景记忆、语义记忆、原始记忆,支持向量语义检索(sqlite-vec)+ BM25关键词搜索 + 记忆自动衰减与”冒泡”晋升 + 梦境模式(空闲时自动凝练新技能候选)。
- MetaSkills 可组合工作流:支持可组合工作流编排、meta-skill-creator自助创作、10+内置与N+社区Skills自动检索,支持Replay回放与Dream模式自我进化。
- 分层安全沙箱:Standard/Strict/Locked三档策略,Linux下使用Bubblewrap系统调用级隔离(CPU/内存/时长/网络),无需Docker即可部署到Serverless环境。
- 统一网关与多通道接入:基于Starlette ASGI的本地网关(默认127.0.0.1:18791),Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等共享同一TurnRunner循环。
- 丰富内置工具集:文件读写编辑、Shell与后台进程、Git、网页搜索(Brave/DuckDuckGo)、SSRF防护、PPT/Word/Excel/PDF生成、图像生成、TTS等。
- 成本追踪与配额管理:每轮/每会话Token与费用汇总,内置配额钩子可自动节流防超支,实现精细化成本控制。
- 微内核插件架构:核心编排器仅约100行代码,负责状态机与管道编排;所有能力(Provider、Memory、Channels、Tools、Sandbox等)均以插件形式运行在”用户空间”,插件崩溃不影响核心。
微信关注回复 “开源”,加入AI开源项目交流群
如何使用OpenSquilla
- 环境准备与安装:确保系统已安装 Python 3.12+,通过 uv 工具一键安装 OpenSquilla(当前版本 0.3.1),支持 Windows、macOS、Linux 全平台。
- 初始化配置:运行 opensquilla onboard 完成首次引导配置,包括设置默认 LLM 提供商、API Key、记忆存储路径及安全沙箱策略(Standard/Strict/Locked)。
- 启动本地网关:执行 opensquilla gateway run 启动基于 Starlette ASGI 的统一网关,默认监听 127.0.0.1:18791,浏览器访问 http://127.0.0.1:18791/control/ 进入 Web 控制台。
- 配置多 LLM 提供商:在控制台或配置文件中添加 OpenAI、Anthropic、DeepSeek、Gemini、Qwen、Moonshot 等 20+ 提供商的 API Key,设置主模型与备用模型,启用 SquillaRouter 自动路由。
- 通过 Web UI 交互:在控制台直接输入任务,系统自动完成模型路由、推理深度判断、记忆检索和工具调用,实时查看每轮 Token 消耗与费用。
- 接入多通道平台:配置 Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix 等通道的 Webhook 或 Bot Token,实现多平台共享同一 Agent 能力。
- 使用与创作 MetaSkills:调用内置 Skills 处理常见任务,或通过 meta-skill-creator 自助创作可组合工作流;启用 Dream 模式让系统在空闲时自动凝练新技能候选。
- 管理记忆与上下文:系统自动维护工作记忆、情景记忆、语义记忆、原始记忆四层架构;支持手动查看、编辑记忆条目,配置自动衰减与冒泡晋升策略。
- 配置安全沙箱:Linux 环境下启用 Bubblewrap 系统调用级隔离,限制 CPU、内存、执行时长和网络访问,无需 Docker 即可安全执行 Shell 和文件操作。
- 监控与配额管理:在控制台查看每轮/每会话的 Token 与费用汇总,设置配额阈值自动节流,防止预算超支。
- 数据迁移(可选):如从 OpenClaw 或 Hermes Agent 迁移,使用官方迁移工具导入记忆、人格文件、Skills 和通道配置,预览并处理冲突项。
OpenSquilla的官网地址
项目官网:https://opensquilla.ai/zh/ 或 https://opensquilla.ai/
GitHub仓库:https://github.com/opensquilla/opensquilla
OpenSquilla的核心优势
- Token成本降低60-80%:通过本地ML智能路由、自适应推理深度、Prompt自动缩放和按需技能加载,在同等预算下实现更高的智能密度。
- 极简微内核架构:核心编排器仅约100行代码,所有能力以插件形式运行在用户空间,单个插件崩溃不影响核心,核心升级不破坏插件。
- 本地智能模型路由:SquillaRouter基于LightGBM+ONNX分类器在设备本地完成评分,自动将任务分配到T0-T3四个层级的最便宜可用模型,零云端路由开销。
- 四层认知记忆系统:工作记忆、情景记忆、语义记忆、原始记忆分层管理,支持向量检索+BM25关键词搜索+自动衰减与”冒泡”晋升,记忆越用越精准。
- 自适应推理与Prompt:仅对复杂查询启用深度推理,简单问题零推理Token消耗;系统Prompt根据任务复杂度自动缩放,避免过度调用。
- 系统级安全沙箱:Linux下采用Bubblewrap实现CPU/内存/时长/网络的系统调用级隔离,无需Docker即可安全部署到Serverless环境。
- 多通道统一网关:基于Starlette ASGI的本地网关,Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信等共享同一TurnRunner循环,一次部署全平台覆盖。
- MetaSkills自我进化:支持可组合工作流、自助创作与社区自动检索,配合梦境模式在空闲时自动凝练新技能候选,实现Agent能力的持续进化。
OpenSquilla的同类竞品对比
| 维度 | OpenSquilla | OpenClaw | Hermes Agent |
|---|---|---|---|
| 架构 | 微内核,5层分离,核心极简,插件自动跳过+回滚 | 插件生态成熟,但层级偏多 | 单体同步主循环,逻辑紧耦合 |
| 成本优化 | ML路由+推理分级+Prompt缓存+按需技能,省60-80% | 配置文件写死主备模型链,不会自动选 | 仅靠关键词+字数粗糙判断,单一路由 |
| MetaSkills | 可组合工作流+自助创作+社区自动检索+梦境进化 | Prompt串联的skill chain,无meta-protocol层 | 无复用工作流抽象,每次从零重写 |
| 记忆系统 | 向量+关键词+去重+衰减+冒泡+自动迁移 | 有衰减/冒泡/多样性重排,但缺四层认知结构 | 仅关键词搜索,语义记忆需外挂 |
| 安全沙箱 | 系统调用级隔离,无需Docker,适合Serverless | Docker可选,OpenShell较轻但仍重 | 危险命令审批+6种执行环境 |
| 成本追踪 | 实际每调用成本+配额自动节流 | 内置定价表,成本写入会话元数据 | 输入/输出/缓存/推理Token分开追踪 |
OpenSquilla的应用场景
- 个人与开发者低成本AI助手:用SquillaRouter智能路由和自适应推理,将Token成本降低60-80%,适合预算有限的个人开发者、独立创作者或学生作为日常编程、写作、问答的AI助手。
- 企业多平台智能客服与办公助手:通过统一网关同时接入飞书、钉钉、企业微信、Slack、Discord等多通道,一套Agent能力覆盖全公司沟通平台,自动处理内部咨询、工单流转和知识问答。
- 高敏感数据场景的私有化AI部署:支持完全自托管与本地运行,四层记忆数据存储在本地,配合Bubblewrap系统级安全沙箱,适合金融、医疗、法律等对数据隐私和合规要求极高的行业。
- 自动化工作流与任务编排:借助MetaSkills可组合工作流和内置工具集(文件编辑、Git、网页搜索、文档生成),实现报告自动生成、代码审查、数据抓取、PPT/Excel批量处理等重复性工作的自动化。
- 多模型策略管理与A/B测试:同时接入20+ LLM提供商并配置主备模型,企业可根据任务复杂度动态分配模型资源,也可用于不同模型间的效果对比与成本优化实验。
- Serverless与边缘计算部署:微内核架构轻量,安全沙箱无需Docker即可运行,适合部署在Serverless函数计算或边缘设备上,作为低资源占用的嵌入式AI服务。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 习近平将发表二〇二六年新年贺词 7904141
- 2 2026年国补政策来了 7808738
- 3 东部战区:开火!开火!全部命中! 7712893
- 4 2026年这些民生政策将惠及百姓 7616985
- 5 小学食堂米线过期2.5小时被罚5万 7519709
- 6 解放军喊话驱离台军 原声曝光 7428214
- 7 为博流量直播踩烈士陵墓?绝不姑息 7327605
- 8 每月最高800元!多地发放养老消费券 7238391
- 9 数字人民币升级 1月1日起将计付利息 7141831
- 10 2026年1月1日起 一批新规将施行 7040675







Dollbaby
