SkillNexus #01 · 你的 Skill 目录，正在变成屎山

Skills 全生命周期创造平台，让你的 Skill 可生成、可量化、可管理、可成长。

SkillNexus 系列导航（共 10 篇）

#	文章
→ 01	你的 Skill 目录，正在变成屎山（本篇）
02	5 分钟完成第一次 Skill 评测
03	从一行描述到可用 Skill——Studio 的 5 种创作模式
04	8 维度评测框架：让"感觉还行"变成数据
05	进化引擎：让 Skill 自动变好
06	Trending 榜单：你的 Skill 资产地图
07	技术架构：Electron 双进程 + 零依赖进化 SDK
08	现状与路线图：SkillNexus 的下一步
09	评测报告不只是看完就算——离线报告系统
10	可视化设计：为什么 Skill 评测需要 6 种图表

打开 ~/.claude/skills/，你能说清楚里面哪个 Skill 还在用、哪个已经失效、哪个其实跟另一个功能重叠吗？

大多数人不能。

这不是管理能力的问题，是 Skill 开发本身缺少基础设施：

Skill 解决了"能力的载体"问题——模块化、可分发、跨工具。但它没有解决：如何知道这个 Skill 好不好？怎么让它持续变好？

SkillNexus 要做的事

一句话：让 AI Skill 可生成、可量化、可进化的全生命周期平台。

核心是一个数据驱动的闭环：

Studio（生成）
    → TestCase（用例）→ Eval（评测）
    → Evo（进化）
    → Trending（榜单）

每一步都不是孤立功能，而是数据流转的节点：

生成有依据——Studio 内置 AI 辅助生成，同时提供 5 维实时质量预评分，写出来就知道大概在什么水平。

评测有标准——8 个维度量化 Skill 在真实任务上的表现：正确性、指令遵循、安全性、完整性、鲁棒性，以及 Skill 自身的可执行性、成本意识、可维护性。每次评测都留下历史记录。

进化有数据——Evo 消费评测历史，自动诊断哪个维度最弱、哪些样本最差，用 4 种算法（EvoSkill / CoEvoSkill / SkillX / SkillClaw）生成改进版本，并对比新旧版本的分数变化，防止回归。

排名有依据——Trending 从所有评测历史中聚合排行，哪个 Skill 真正在用、真正好用，数据说话。

你的 Skill 文件和 API Key 都是本地资产，不应该经过任何第三方服务器。

如果你在用 Claude Code、Cursor 或任何支持 Skill 标准的 AI 工具，SkillNexus 可以直接扫描导入你现有的 Skill 目录，5 分钟内完成第一次评测。

SkillNexus · 2026 · skyseraph · GitHub