SkillNexus #02 · 5 分钟完成第一次 Skill 评测——SkillNexus 上手指南

Skills 全生命周期创造平台，让你的 Skill 可生成、可量化、可管理、可成长。

SkillNexus 系列导航（共 10 篇）

#	文章
01	你的 Skill 目录，正在变成屎山
→ 02	5 分钟完成第一次 Skill 评测（本篇）
03	从一行描述到可用 Skill——Studio 的 5 种创作模式
04	8 维度评测框架：让"感觉还行"变成数据
05	进化引擎：让 Skill 自动变好
06	Trending 榜单：你的 Skill 资产地图
07	技术架构：Electron 双进程 + 零依赖进化 SDK
08	现状与路线图：SkillNexus 的下一步
09	评测报告不只是看完就算——离线报告系统
10	可视化设计：为什么 Skill 评测需要 6 种图表

这篇是纯操作指南。目标：从零开始，5 分钟内完成第一次 Skill 评测，看到 8 维度评分雷达图。

Step 1：安装

1
2
3
4
git clone https://github.com/skyseraph/SkillNexus.git
cd SkillNexus
npm install && npm run rebuild
npm run dev

支持 macOS 和 Windows。首次启动会引导你配置 LLM Provider。

进入 Settings → LLM Providers，选择你的 Provider：

填入 Key 后点 Test Connection，绿色即可。

Home 页面 → 扫描导入

SkillNexus 会自动扫描以下目录：

扫描完成后，所有 Skill 以卡片形式展示，包含名称、描述、标签、信任等级。

如果你还没有 Skill，推荐先跳到 03 · Studio 生成一个，再回来跑评测。

选中一个 Skill，进入 TestCase 标签页，点击 AI 生成用例。

SkillNexus 会根据 Skill 的描述和指令，自动生成覆盖 8 个评测维度的测试用例。每条用例包含：

生成后可以手动调整，也可以直接用。建议先用 3～5 条用例跑通流程。

进入 Eval 页面，选择目标 Skill，点击 开始评测。

评测过程：

评测完成后，你会看到：

8 个维度分两组：

G 系列（任务质量）——这个 Skill 产出的结果好不好：

S 系列（Skill 质量）——这个 Skill 本身写得好不好：

G 系列告诉你"有没有做对事"，S 系列告诉你"有没有把事做好"。

有了评分，就可以让 Evo 引擎自动改进 Skill 了。

SkillNexus · 2026 · skyseraph · GitHub