Karakeep 全面分析
2026-06-28Hermes Researchv0.32.0
项目概述
Karakeep(前身 Hoarder)是一个面向个人与小型团队的自托管书签管理工具,将书签、笔记、全文存档、图片管理与 AI 自动标签整合在单一界面。它强调「链接即资产」——所有保存的页面会被自动抓取正文、转写图片 OCR、生成向量索引,让书签真正可被搜索与复用。
Karakeep 是少数将「全文搜索 + 全页存档 + AI 标签 + 协作列表」四件事都做到位的自托管方案。相比 Pocket、Raindrop 等云服务,它的最大差异是:所有数据完全在你自己的服务器上,并且支持 Meilisearch 这种高性能搜索引擎而非 ElasticSearch。
功能全景
Karakeep 的功能覆盖面比同类工具更广,按层次划分如下:
核心功能
- 单页 / 批量 URL 保存(支持浏览器扩展与移动分享)
- 全页 HTML 存档(Puppeteer 无头渲染)
- Meilisearch 全文 + 向量双引擎搜索
- 多层级标签 + 智能列表(类似 Notion 数据库视图)
- 图片 OCR(tesseract)
- 视频自动下载(yt-dlp)
- RSS 订阅自动入库
AI 特性
Karakeep 的 AI 层不是噱头,是真正能用的能力——通过 OPENAI_API_KEY 或本地 Ollama 即可启用:
| AI 能力 | 说明 | 支持的提供商 |
|---|---|---|
| 自动标签生成 | 基于正文为每条书签打 3-5 个标签 | Ollama / OpenAI / Gemini / Anthropic |
| 语义搜索 | 用向量相似度匹配查询意图 | Ollama Embeddings / OpenAI Embeddings |
| 摘要生成 | 长文章自动生成 TL;DR | 同上 |
| 图片描述 | 多模态模型为图片生成 alt 文字 | GPT-4V / Gemini Vision |
Karakeep 是少数能在完全本地(Ollama)跑 AI 标签的自托管书签工具,对隐私敏感用户是稀缺选项。
技术架构
Karakeep 采用单体 Next.js + 三容器(Web / Chrome / Meilisearch)的轻量架构,对单台 2C4G 服务器非常友好:
| 组件 | 技术栈 | 职责 |
|---|---|---|
| Web (Next.js) | React 19 + tRPC + Drizzle ORM | UI 与 API 网关 |
| Database | SQLite (默认) / Postgres | 元数据 + 标签 + 用户 |
| Chrome | Puppeteer 无头 | 全页渲染与截图 |
| Meilisearch | v1.10+ | 全文 + 向量索引 |
| Workers | BullMQ + Redis | 异步任务队列 |
部署指南
Karakeep 提供官方 docker-compose.yml,一键启动三个容器:
services:
web:
image: ghcr.io/karakeep-app/karakeep:latest
ports:
- "3000:3000"
environment:
- DATA_DIR=/data
- MEILI_ADDR=http://meilisearch:7700
meilisearch:
image: getmeili/meilisearch:v1.10
chrome:
image: ghcr.io/puppeteer/puppeteer:latest
启动后访问 localhost:3000,按 Ctrl+K 打开全局搜索。
使用指南
基本操作:
| 操作 | 快捷键 | 说明 |
|---|---|---|
| 新建书签 | C | 粘贴 URL 自动抓取正文 |
| 全局搜索 | Ctrl+K | Meilisearch 即时返回 |
| 批量标签 | T | 选中多条后批量打标签 |
| 协作列表 | — | 分享只读链接给团队成员 |
优缺点对比
优点
- AI 标签 / 语义搜索 真能用,不是 PPT 功能
- 完全自托管 + AGPL-3.0,无任何云依赖
- Meilisearch 替代 ElasticSearch,资源占用低
- OCR + 视频下载等差异化能力
- 活跃维护(最近 24h 内有 commit)
缺点
- 移动端 App 仍为 PWA,原生体验弱
- 协作功能仅支持只读共享,不能多人编辑
- Chrome 容器占用约 500MB 内存
- 中文 OCR 准确率一般,需额外配置 tessdata
总结评分
| 维度 | 评分 | 评语 |
|---|---|---|
| 功能完整度 | 9 / 10 | 覆盖书签 + 笔记 + AI + 存档,罕见 |
| 部署难度 | 8 / 10 | Compose 一键,但 Chrome 容器需要 1GB+ 内存 |
| 性能 | 9 / 10 | Meilisearch 即时搜索,10k+ 书签无压力 |
| 隐私 | 10 / 10 | 本地 Ollama 全程不出网 |
| 生态活跃度 | 8 / 10 | 26k stars,月度稳定迭代 |
推荐场景:需要「真·自托管 + AI 标签 + 全栈搜索」的个人 / 小团队;不希望被 SaaS 锁定、且能提供 ≥2GB 内存的服务器用户。不推荐:追求极致轻量(<256MB)、仅需基础书签功能的用户,可改用 linkding。