TiniX AI, Hanoi (2026)

10/05/2026

🚀 Dự án quản lý tài liệu self-hosted hơn 40k⭐ trên GitHub đang được dân homelab và doanh nghiệp nhỏ dùng để “số hoá cả đống giấy tờ”

Bạn scan hoá đơn, hợp đồng, giấy tờ cá nhân… rồi hệ thống tự OCR + phân loại + tìm kiếm như Google Drive riêng của bạn 😳

Các tính năng nổi bật:

* OCR hơn 100 ngôn ngữ bằng Tesseract
* Tự động gắn tag/document type bằng machine learning
* Full-text search cho PDF và ảnh scan
* Hỗ trợ PDF, Word, Excel, PowerPoint…
* Lưu trữ PDF/A cho backup lâu dài
* API đầy đủ để tích hợp hệ thống khác
* Chạy cực ổn với Docker Compose
* Dữ liệu self-hosted, không phụ thuộc cloud

Điểm thú vị:

* Cộng đồng cực mạnh với hơn 40k⭐ GitHub
* Có app iOS bên thứ ba tích hợp AI local bằng Gemma 4
* Team dev đang thử nghiệm thêm tính năng AI native cho bản 3.0 👀

Rất hợp để:

* Xây NAS cá nhân
* Lưu trữ giấy tờ doanh nghiệp
* Digital hóa văn phòng
* Backup tài liệu gia đình
* Làm “Google Photos cho PDF” 😆

Nguồn tham khảo:

10/05/2026

🇻🇳 Nguồn mở Việt Nam cho phép các Seller Shopee có thể xây dựng các giải pháp tự động hoặc tích hợp AI một cách thuận tiện

Shopee SDK là thư viện mã nguồn mở hỗ trợ gần như đầy đủ Shopee Open Platform API V2, giúp dev không cần tự xử lý request signing, OAuth, token refresh hay retry logic nữa.

🔥 Điểm mạnh nổi bật:
• Hỗ trợ hơn 27 API Managers
• Full TypeScript type-safe
• Auto refresh token thông minh
• Built-in error handling & retry
• Webhook / Push notification đầy đủ
• Multi-region: Việt Nam, Global, Thailand…
• Proxy support
• Test coverage cao
• Zero heavy dependencies

📦 Các module rất đầy đủ:
• ProductManager
• OrderManager
• LogisticsManager
• ChatManager
• Voucher / Discount / Flash Sale
• LivestreamManager
• AdsManager
• Media upload
• FBS / SBS
• Merchant & Account Health
• Push/Webhook Manager

💡 Rất phù hợp để build:
• Dashboard quản lý seller
• ERP / CRM tích hợp Shopee
• Đồng bộ tồn kho đa kênh
• AI auto-reply chat
• Quản lý đơn hàng realtime
• Tool agency cho nhiều shop
• Analytics & automation

🛠 Tech stack hiện đại:
• TypeScript
• Node.js 20+
• Jest
• ESLint + Prettier
• Husky
• CI/CD tự động

📌 Điều mình đánh giá cao:
Dự án được maintain khá nghiêm túc, update nhanh theo thay đổi API của Shopee và docs rất rõ ràng — điều cực kỳ quan trọng với hệ sinh thái Shopee vốn thay đổi liên tục.

Nếu bạn đang làm automation hoặc AI tools cho seller Shopee, đây gần như là SDK TypeScript đầy đủ nhất hiện tại. 🚀

10/05/2026

🚀 NVIDIA ra mắt Star Elastic – Một checkpoint AI chứa đồng thời 30B, 23B và 12B reasoning models

NVIDIA vừa giới thiệu Star Elastic (Nemotron Elastic) – kỹ thuật cực kỳ thú vị cho phép “nhúng” nhiều mô hình con vào cùng một checkpoint duy nhất.

Thay vì phải train và lưu riêng từng model size, giờ đây một checkpoint có thể hoạt động như nhiều model khác nhau:
• 30B (3.6B active params)
• 23B (2.8B active params)
• 12B (2.0B active params)

Điều đặc biệt là các model con này có thể được “cắt” ra zero-shot, không cần fine-tune thêm.

🧠 Ý tưởng giống “Russian dolls” cho LLMs
Model nhỏ là tập con tối ưu của model lớn, chia sẻ weights, KV cache và kiến thức bên trong. NVIDIA gọi đây là “Many-in-One Reasoning LLMs”.

⚡ Điểm nổi bật:
• Một checkpoint → nhiều kích cỡ model
• Dynamic budget control: reasoning bằng model nhỏ, trả lời cuối bằng model lớn
• Giảm mạnh latency và chi phí inference
• Chạy được trên GPU consumer như RTX 5080 với NVFP4
• Hỗ trợ BF16, FP8, NVFP4
• Tiết kiệm tới 360× chi phí so với train riêng từng model

🔥 Star Elastic hoạt động trên Nemotron Nano v3:
• Hybrid Mamba + Transformer + MoE
• Context window tới 1M tokens
• Tối ưu cho reasoning, coding, toán học

📊 Theo benchmark:
• +16% accuracy với elastic budget control
• Giảm latency ~1.9×
• RTX Pro 6000 đạt ~7,426 tok/s
• Nested models ngang hoặc vượt model độc lập cùng size

💡 Điểm thú vị nhất:
Thinking phase có thể dùng model nhỏ hơn để generate reasoning trace cực nhanh, sau đó “scale up” sang model lớn cho final answer — tất cả trong cùng một inference session.

Điều này mở ra hướng đi rất mới cho:
• Local LLMs
• Multi-agent reasoning
• Dynamic inference
• AI tiết kiệm compute nhưng vẫn mạnh

📄 Paper:
• “Nemotron Elastic: Towards Efficient Many-in-One Reasoning LLMs”
• “Star Elastic: Many-in-One Reasoning LLMs with Efficient Budget Control” (ICML 2026)

Star Elastic cho thấy tương lai của AI không chỉ là model lớn hơn, mà còn là model linh hoạt hơn, tiết kiệm hơn và thích nghi theo từng giai đoạn suy luận. 🚀

10/05/2026

🔊 Nguồn mở Text-to-Speech siêu nhẹ chạy CPU, không cần GPU

Pocket TTS là dự án TTS mã nguồn mở từ Kyutai Labs, được thiết kế để chạy cực nhẹ trên CPU nhưng vẫn cho chất lượng giọng nói rất ấn tượng.

🔥 Điểm nổi bật:
• Chỉ ~100M parameters
• Chạy hoàn toàn bằng CPU
• Latency ~200ms
• Tốc độ ~6x realtime trên MacBook Air M4
• Streaming audio realtime
• Voice cloning
• Hỗ trợ nhiều ngôn ngữ
• Có thể chạy trực tiếp trên browser/WebAssembly

Pocket TTS hỗ trợ:
• Python API
• CLI
• HTTP server local
• OpenAI-compatible integrations

Cài nhanh:

uvx pocket-tts generate

Hoặc chạy web UI local:

uvx pocket-tts serve

Đây là một trong những dự án TTS local thú vị nhất hiện nay, đặc biệt cho xu hướng AI chạy trực tiếp trên thiết bị thay vì phụ thuộc cloud. 🚀

09/05/2026

📱 Nguồn mở nuôi “tôm” claw ngay trên iPhone bằng Gemma 4 phiên bản tăng tốc MTP mới nhất

PhoneClaw là dự án mã nguồn mở biến iPhone thành AI Agent cá nhân chạy hoàn toàn cục bộ. Không cloud, không upload dữ liệu, mọi thứ xử lý trực tiếp trên thiết bị.

🔥 Điểm nổi bật:
• Chạy offline 100% với Gemma 4 LiteRT-LM
• Hỗ trợ text, voice, image, camera realtime
• LIVE mode: nói chuyện thời gian thực
• Tích hợp iOS: Calendar, Reminder, Contacts, HealthKit…
• Skill system mở rộng bằng file SKILL.md

⚡ Bản v1.3.2 mới:
• Fix lỗi download model
• Thêm MTP speculative decoding tăng tốc inference
• Tối ưu Metal/GPU performance

PhoneClaw cho thấy tương lai của AI cá nhân:
Private-first, local-first và không phụ thuộc cloud.

Một trong những dự án AI mobile thú vị nhất hiện nay. 🚀

09/05/2026

Dự án dành khá tốt trong thu thập dữ liệu và điều khiển automation - CloakBrowser là dự án Chromium stealth mã nguồn mở dành cho browser automation và scraping hiện đại.

Điểm nổi bật nhất:

* Patch trực tiếp Chromium bằng C++
* Không phụ thuộc stealth plugin hay JS injection
* Giảm mạnh dấu hiệu automation detection

Hỗ trợ vượt qua nhiều hệ thống anti-bot phổ biến:

* Cloudflare
* FingerprintJS
* reCAPTCHA v3
* DataDome

Tính năng đáng chú ý:

* Stealth fingerprinting
* Browser profile isolation
* Playwright/Puppeteer compatible
* Docker support
* Multi-profile browser
* Anti-detect automation
* GPU/WebGL/Canvas spoofing

Ngoài automation, dự án còn hướng tới làm open-source alternative cho:

* Multilogin
* GoLogin
* AdsPower

Rất phù hợp cho:

* AI agents
* web automation
* scraping
* multi-account workflows
* browser testing

09/05/2026

Baidu vừa chính thức phát hành ERNIE 5.1 — phiên bản mới nhất của dòng model ERNIE với hướng đi rất đáng chú ý:

👉 không chạy đua “parameter càng lớn càng tốt”
mà tập trung vào efficiency + cost optimization.

Điểm nổi bật nhất của ERNIE 5.1:

* tổng tham số giảm còn khoảng 1/3 so với ERNIE 5.0
* active parameters giảm còn khoảng 1/2
* chi phí pre-training chỉ khoảng 6% so với model cùng cấp

Nhưng hiệu suất vẫn rất mạnh ở:

* reasoning
* math
* coding
* agent capabilities
* legal/government tasks

Theo các leaderboard gần đây, ERNIE 5.1 Preview từng đứng top đầu trong các model Trung Quốc trên LMArena/Text Arena.

Điểm thú vị hơn nằm ở kiến trúc phía sau.

Baidu đang đẩy rất mạnh hướng:

* elastic pretraining
* sparse MoE
* asynchronous RL
* multi-teacher distillation
* agent-oriented training

Tức là thay vì scale model kiểu truyền thống:

❌ nhiều GPU hơn
❌ nhiều tham số hơn

→ họ tối ưu “intelligence density” và runtime efficiency.

Một insight rất đáng chú ý:

Xu hướng AI 2026 bắt đầu chuyển từ:

“model lớn nhất”
→
“model hiệu quả nhất”.

Và ERNIE 5.1 là ví dụ khá rõ cho xu hướng đó.

Ngoài reasoning và benchmark, Baidu còn nhấn mạnh khả năng:

* creative writing
* long-form storytelling
* understanding user intent
* agent workflows

Model hiện đã có thể trải nghiệm trên ERNIE Bot.

09/05/2026

Nguồn mở AI Quant — nền tảng giao dịch định lượng tự host tích hợp AI từ đầu đến cuối.

QuantDinger là một dự án mã nguồn mở rất đáng chú ý theo hướng “AI Quant Operating System” thay vì phải ghép nhiều tool riêng lẻ như:

* TradingView
* Jupyter Notebook
* Telegram bot
* backtesting engine
* exchange API

→ QuantDinger gom toàn bộ vào một stack duy nhất.

Dự án hỗ trợ:

* AI market research
* generate strategy bằng Python
* backtesting deterministic
* live trading
* portfolio monitor
* multi-exchange ex*****on
* AI agents qua MCP

Điểm nổi bật nhất ở phiên bản mới là tích hợp rất sâu với AI coding agents:

* Claude Code
* Cursor
* Codex
* MCP workflow

→ AI có thể trực tiếp:

* phân tích thị trường
* viết strategy
* chạy backtest
* đánh giá kết quả
* hỗ trợ tối ưu workflow quant

Một insight rất thú vị:

Xu hướng hiện tại đang chuyển từ:

❌ trading bot đơn lẻ
→
✅ AI-native quant platform

Tức là AI không chỉ “gợi ý tín hiệu”, mà bắt đầu tham gia toàn bộ vòng đời:

research → coding → testing → ex*****on.

Ngoài ra dự án còn đi mạnh theo hướng:

* self-hosted
* privacy-first
* local control
* full-stack deployment bằng Docker

→ rất phù hợp cho trader hoặc team muốn kiểm soát hoàn toàn dữ liệu và API keys.

Đây có thể là một trong những hướng phát triển lớn tiếp theo của AI:

👉 AI agents cho quantitative trading workflow.

09/05/2026

DFlash là một dự án rất đáng chú ý trong mảng tăng tốc inference cho LLM, đặc biệt ở hướng speculative decoding thế hệ mới.

Điểm khác biệt lớn:

❌ draft token theo kiểu autoregressive truyền thống
✅ dùng block diffusion để draft cả cụm token song song chỉ trong 1 forward pass.

Nói đơn giản:

Thay vì đoán từng token một như EAGLE hay speculative decoding cũ, DFlash có thể “đoán trước cả đoạn”.

Kết quả benchmark khá ấn tượng:

* speedup tới ~6x trên một số model
* nhanh hơn EAGLE-3 khoảng ~2.5x
* vẫn giữ output lossless (giống hệt model gốc)

DFlash hỗ trợ khá nhiều model:

* Qwen3 / Qwen3.5
* Gemma 4
* Qwen Coder
* Llama 3.1
* MiniMax, Kimi…

và chạy được với:

* vLLM
* SGLang
* MLX
* Transformers

Insight thú vị nhất:

DFlash cho thấy diffusion model không chỉ dùng để sinh ảnh/video.

👉 diffusion cũng có thể trở thành “draft engine” cho LLM inference.

Đây có thể là một hướng rất lớn của AI runtime tương lai:

❌ next-token only
✅ next-block generation

Tuy nhiên cộng đồng cũng chỉ ra vài điểm quan trọng:

* hiệu quả nhất trên dense model
* gain giảm khi quant thấp hoặc context quá dài
* multi-user/concurrency chưa quá lý tưởng
* phù hợp local/single-user hơn production lớn

Dù vậy, DFlash vẫn là một trong những bước tiến đáng chú ý nhất gần đây trong cuộc đua:

👉 làm LLM nhanh hơn mà không giảm chất lượng.

Xu hướng hiện tại rất rõ:

AI không còn chỉ cạnh tranh “model mạnh hơn”

mà đang chuyển sang:

* inference architecture
* runtime optimization
* speculative systems
* latency engineering

08/05/2026

Một hướng tiếp cận tiềm năng cho việc sử dụng model SLM Qwen3.5 0.8B - invoice_schema là một dự án rất thú vị cho bài toán OCR hóa đơn bằng AI theo hướng “schema-driven extraction”.

Thay vì output cố định như OCR truyền thống, model cho phép bạn tự định nghĩa JSON schema cần lấy:

* ngày hóa đơn
* mã invoice
* khách hàng
* danh sách sản phẩm
* thuế, tổng tiền
* hoặc bất kỳ field nào riêng cho doanh nghiệp

→ AI sẽ tự map dữ liệu từ ảnh hóa đơn sang đúng format JSON đó.

Điểm đáng chú ý:

👉 model khá nhỏ (~0.8B)
👉 chạy local bằng GGUF
👉 hỗ trợ multimodal (ảnh + text)
👉 tương thích OpenAI API format

Rất phù hợp để build:

* hệ thống nhập liệu kế toán
* OCR hóa đơn doanh nghiệp
* RAG tài liệu tài chính
* automation cho SME
* xử lý PDF/invoice nội bộ

Một insight rất hay:

Xu hướng OCR hiện tại đang chuyển từ:

❌ text extraction
→
✅ structured understanding

Tức là AI không chỉ đọc chữ nữa, mà hiểu cấu trúc tài liệu và trả về dữ liệu có thể dùng ngay cho workflow.

Ngoài ra việc chạy local cũng rất quan trọng:

* bảo mật dữ liệu tài chính
* không cần upload cloud
* dễ deploy nội bộ doanh nghiệp

Nếu kết hợp thêm PaddleOCR hoặc pipeline document AI khác, đây có thể trở thành một hệ thống invoice processing khá mạnh với chi phí thấp.

08/05/2026

OpenReel Video vừa ra mắt bản v0.2.0 với rất nhiều nâng cấp đáng chú ý cho trình chỉnh sửa video chạy hoàn toàn trên trình duyệt.

Đây là dự án mã nguồn mở theo hướng thay thế CapCut/Web editor nhưng:

* không cần cài đặt
* không upload video lên cloud
* không watermark
* xử lý trực tiếp trên máy người dùng

Điểm nổi bật nhất của v0.2.0:

* Click trực tiếp vào SVG/sticker trên preview để chọn layer
* Hover hiển thị giới hạn clip trực quan hơn
* Tách nhiều track audio từ một file video thành timeline riêng
* Cải thiện waveform audio
* Tối ưu bộ nhớ khi export video dài

→ workflow edit bắt đầu tiệm cận editor desktop thực thụ.

OpenReel Video sử dụng:

* React + TypeScript
* WebGPU + WebCodecs
* IndexedDB autosave
* render/export hoàn toàn client-side

Một insight rất thú vị:

AI và web platform đang khiến các ứng dụng “native-only” trước đây dần chuyển sang browser.

Trước đây rất khó tưởng tượng:

👉 edit video nhiều track + export 4K ngay trên trình duyệt.

Nhưng giờ điều đó đang dần khả thi nhờ:

* WebGPU
* WebCodecs
* local processing
* browser performance mới

Xu hướng hiện tại đang rất rõ:

❌ web app chỉ dành cho tác vụ nhẹ
✅ browser trở thành creative workstation thực sự

Và OpenReel Video là một ví dụ rất đáng chú ý cho tương lai đó.

TiniX AI

10/05/2026

10/05/2026

10/05/2026

10/05/2026

09/05/2026

09/05/2026

09/05/2026

09/05/2026

09/05/2026

08/05/2026

08/05/2026

Address

Website

Alerts

Shortcuts

Share

Category