Trang này dành cho bạn nào muốn dùng full pipeline — có cả tạo voice tự động bằng AI, render video Remotion, chứ không chỉ index asset. Nếu bạn chỉ cần Asset Index (drop ảnh/video → search), dùng Bắt đầu nhanh sẽ nhẹ hơn (auto installer làm hộ phần lớn).Toàn bộ lệnh trong trang này gõ trong PowerShell as Administrator. Mở: nhấn
Win + X → chọn Terminal (Admin) hoặc Windows PowerShell (Admin).Bạn sẽ cài 4 phần mềm
| Phần mềm | Vai trò (dùng để làm gì?) | Bắt buộc? |
|---|---|---|
| Python 3.10+ | Ngôn ngữ chạy mọi tool & skills trong repo (asset index, audio dedupe, semantic mapper…) | Có |
| ffmpeg + ffprobe | Bộ công cụ chuẩn để đọc/cắt/ghép audio và video. Mọi pipeline media đều cần | Có |
| Node.js 20+ + npm | Chạy renderer Remotion (viết video bằng React) khi tới bước render cuối | Cần nếu sẽ render |
| Git | Tải code mới về (git clone) và update sau này (git pull) | Có (trừ khi tải ZIP) |
Các bước
Cài 4 phần mềm bằng winget
winget là gì? Là “Microsoft Store cho terminal” — đi kèm sẵn Windows 10/11, gõ 1 lệnh là cài xong, không phải tải Cài xong, đóng PowerShell và mở lại (để PATH cập nhật), rồi verify:
.msi từng cái.Mở PowerShell as Administrator, dán lần lượt:Python.Python.3.12 — Python bản ổn định nhất hiện tại.
Gyan.FFmpeg — package ffmpeg phổ biến cho Windows, kèm luôn ffprobe.
OpenJS.NodeJS — Node.js, kèm luôn npm.
Git.Git — Git CLI chính thức.Tải repo về máy
Chọn 1 trong 2 cách (xem chi tiết trong Bắt đầu nhanh — Bước 1):Cách nhanh (Git, khuyến nghị):Sau lệnh này, PowerShell đang đứng trong thư mục
C:\Users\<bạn>\video-automator-skills\. Mọi lệnh phía dưới đều chạy ở đây.Tạo môi trường Python riêng (.venv) + cài thư viện
Tại sao cần Bước này tải mạng nhiều, cần ~30-60 giây tuỳ tốc độ internet.
.venv? Để cài đặt thư viện Python của repo này không đè lên Python hệ thống — sau này muốn xoá repo chỉ cần xoá folder, không ảnh hưởng máy.python -m venv .venv— tạo folder ẩn.venv\chứa bản Python riêng cho repo..venv\Scripts\python -m pip install --upgrade pip— nâng cấppip(trình quản lý thư viện) trong.venvlên bản mới.pip install -r tools\asset_index\requirements.txt— đọc danh sách thư viện trong filerequirements.txtrồi cài tự động.
Tạo file .env và điền API keys
API key là gì? Là “mật khẩu” để repo gọi dịch vụ AI (OpenAI, Gemini). Mỗi lần phân tích ảnh/video, repo gửi yêu cầu đến server OpenAI/Gemini — server kiểm tra key trước khi trả lời.Tạo file Mở Không điền key theo ví dụ copy rời trong trang này để tránh lệch cấu hình.Hãy mở Cấu hình API keys và làm đúng theo trang đó (nguồn chuẩn duy nhất, luôn cập nhật).Trang đó có đầy đủ:
.env từ template có sẵn:.env bằng Notepad:- Biến nào bắt buộc / tuỳ chọn
- Cách tạo từng key
- Ví dụ
.envmới nhất - Cách verify key hoạt động
Cài Remotion skill (chỉ khi sẽ render Remotion)
Bước này bỏ qua nếu bạn chưa render video Remotion. Lệnh chạy bằng Git Bash hoặc WSL (vì là Script này tự cài skill
.sh):$remotion-best-practices vào folder .agents\skills\ — khi agent (Cursor, Claude Code) đụng tới Remotion sẽ đọc skill này để biết best practice.Đăng ký watcher chạy nền (luôn bật)
Watcher là gì? Là chương trình chạy ngầm — mỗi khi bạn drop file vào Lệnh này tạo task
raw_assets\, watcher tự phát hiện, gọi AI phân tích, lưu vào DB. Không cần bật/tắt thủ công.Đăng ký watcher với Windows để tự bật mỗi khi đăng nhập:VideoAgentAssetIndex trong Task Scheduler (cơ chế chuẩn của Windows để chạy chương trình ngầm).Kiểm tra watcher đã bật:state.json phải có pid (số > 0) và last_error: null. Nếu fail, xem Khắc phục sự cố.Verify — test cuối
Test cả pipeline đã sẵn sàng:Phải trả về ≥ 1 kết quả với
- Copy 1 ảnh bất kỳ vào folder
raw_assets\images\. - Đợi ~5-10 giây (watcher debounce + Gemini phân tích + OpenAI embed).
- Search bằng từ khoá khớp nội dung ảnh:
score > 0.5. Nếu không → đọc Khắc phục sự cố.Lưu ý đặc thù Windows
Tiếng Việt vỡ font trong terminal
Tiếng Việt vỡ font trong terminal
Tất cả Hoặc set vĩnh viễn cho PowerShell session:
.bat đã có chcp 65001 để dùng UTF-8. Nếu chạy thủ công trong PowerShell và thấy chữ vỡ:Defender chặn .bat
Defender chặn .bat
Nếu Windows Defender chặn
setup\Install.bat: chuột phải file → Properties → tick Unblock → Apply.WSL có dùng được không?
WSL có dùng được không?
Có. Trong WSL (Ubuntu trong Windows), làm theo hướng dẫn Linux. Nhưng nếu đặt repo ở
/mnt/c/... (filesystem Windows mount sang Linux), watcher không nhận file mới — phải dùng --polling hoặc đặt repo trong filesystem WSL native (~/).Xong rồi! Tiếp theo làm gì?
Hiểu các API keys
Vai trò từng key, link tạo, giới hạn quota miễn phí.
Sử dụng cơ bản
Drop file → search → status — workflow hằng ngày.
Cấu trúc dự án
Hiểu vai trò các thư mục
skills\, jobs\, tools\.Khắc phục sự cố
8 lỗi hay gặp + cách xử lý.