Skill ID:
$video-audio-extractor · SourceMục đích
Skill này tách audio trực tiếp từ file video (.mp4, .mov, …) thành file rời để tái sử dụng trong pipeline.
- Với audio giọng nói: ưu tiên xuất
.wavđể transcript và xử lý timestamp ổn định. - Với audio làm nhạc nền: có thể xuất
.mp3để nhẹ dung lượng.
Khi nào được invoke
- User muốn lấy nhạc/audio ra khỏi video.
- Cần chuyển một video đã render thành đầu vào audio cho pipeline kế tiếp.
- Cần chuẩn bị file audio để chạy
$word-timestamps-extractorhoặc$audio-deduplicate.
Cách sử dụng
Gõ trong chat:Input / Output chuẩn
- Input: video trong job, ví dụ
jobs/<id>/input/raw_assets/<video>.mp4. - Output mặc định:
jobs/<id>/input/audio/<video>.wav. - Output tùy chọn:
jobs/<id>/input/audio/<video>.mp3.
Khuyến nghị dùng WAV cho speech pipeline. Dùng MP3 khi mục tiêu là nhạc nền gọn nhẹ.
Lệnh mẫu
Extract WAV:Liên thông với skill khác
$word-timestamps-extractor: dùng file WAV vừa tạo để sinh transcript/timestamp cấp từ.$audio-deduplicate: nếu audio speech bị lặp/restart, chạy dedupe trên file vừa extract.$video-render-plan-builder: nếu file là nhạc nền, map vàoaudio.music.pathtrong render plan.
Lưu ý
- Nếu video không có audio stream, skill sẽ fail sớm và báo lỗi rõ.
- Skill không tự cắt timeline audio; việc cắt/trộn xử lý ở render plan hoặc renderer.