Skill ID:
$word-timestamps-extractor · SourceMục đích
Lấy file audio narration → trả về transcript có timestamp cấp câu + cấp từ dùng cho subtitle, dedupe, và căn cảnh asset.Khi nào được invoke
- Sau khi đã có audio voice (từ
$ausynclab-voicehoặc upload thủ công). - Trước
$semantic-asset-mappervà$video-render-plan-builder— cả 2 đều cần timeline word-level. - User muốn đổi cách render subtitle / đổi audio gốc.
Cách sử dụng
CầnOPENAI_API_KEY trong .env. Gõ:
source/transcript_word_level.toml.