10/05/2026
🚀 Dự án quản lý tài liệu self-hosted hơn 40k⭐ trên GitHub đang được dân homelab và doanh nghiệp nhỏ dùng để “số hoá cả đống giấy tờ”
Bạn scan hoá đơn, hợp đồng, giấy tờ cá nhân… rồi hệ thống tự OCR + phân loại + tìm kiếm như Google Drive riêng của bạn 😳
Các tính năng nổi bật:
* OCR hơn 100 ngôn ngữ bằng Tesseract
* Tự động gắn tag/document type bằng machine learning
* Full-text search cho PDF và ảnh scan
* Hỗ trợ PDF, Word, Excel, PowerPoint…
* Lưu trữ PDF/A cho backup lâu dài
* API đầy đủ để tích hợp hệ thống khác
* Chạy cực ổn với Docker Compose
* Dữ liệu self-hosted, không phụ thuộc cloud
Điểm thú vị:
* Cộng đồng cực mạnh với hơn 40k⭐ GitHub
* Có app iOS bên thứ ba tích hợp AI local bằng Gemma 4
* Team dev đang thử nghiệm thêm tính năng AI native cho bản 3.0 👀
Rất hợp để:
* Xây NAS cá nhân
* Lưu trữ giấy tờ doanh nghiệp
* Digital hóa văn phòng
* Backup tài liệu gia đình
* Làm “Google Photos cho PDF” 😆
Nguồn tham khảo: