卡卡字幕助手
VideoCaptioner
一款基於大語言模型(LLM)的視頻字幕處理助手,支持語音識別、字幕斷句、優化、翻譯全流程處理
簡體中文 / [正體中文](./docs/README_TW.md) / [English](./docs/README_EN.md) / [日本語](./docs/README_JA.md)
## 📖 項目介紹
卡卡字幕助手(VideoCaptioner)操作簡單且無需高配置,支持網絡調用和本地離線(支持調用 GPU)兩種方式進行語音識別,利用大語言模型進行字幕智能斷句、校正、翻譯,全流程一鍵處理字幕視頻!為視頻配上效果驚艷的字幕。
最新版本已經支持 VAD、人聲分離、字級時間戳、批量字幕等實用功能
- 🎯 無需 GPU 即可使用強大的語音識別引擎,生成精準字幕
- ✂️ 基於 LLM 的智能分割與斷句,字幕閱讀更自然流暢
- 🔄 AI 字幕多線程優化與翻譯,調整字幕格式、表達更地道專業
- 🎬 支持批量視頻字幕合成,提升處理效率
- 📝 直觀的字幕編輯查看介面,支持即時預覽和快捷編輯
- 🤖 消耗模型 Token 少,且內置基礎 LLM 模型,保證開箱即用
## 📸 介面預覽