Kaka カカ字幕アシスタント
VideoCaptioner
音声認識、字幕のセグメンテーション、最適化、翻訳をサポートするLLM駆動のビデオ字幕処理アシスタント。
[简体中文](./README.md) / [正體中文](./docs/README_TW.md) / [English](./docs/READNE_EN.md) / 日本語
## 📖 はじめに
Kaka 字幕アシスタント(VideoCaptioner)は操作が簡単で、高性能なハードウェアを必要としません。音声認識のためのオンラインAPI呼び出しとローカルオフライン処理(GPUサポートあり)の両方をサポートしています。大規模言語モデル(LLM)を活用して、インテリジェントな字幕のセグメンテーション、修正、翻訳を行います。ビデオ字幕のワークフロー全体をワンクリックで解決します!あなたのビデオに素晴らしい字幕を追加しましょう。
最新バージョンでは、VAD、ボーカル分離、単語レベルのタイムスタンプ、バッチ字幕処理、その他の実用的な機能をサポートしています。
- 🎯 強力な音声認識エンジンを使用するためにGPUは不要で、正確な字幕生成が可能です。
- ✂️ LLMベースのインテリジェントなセグメンテーションと文の分割で、より自然な字幕の読み取りを実現。
- 🔄 AI字幕のマルチスレッド最適化と翻訳、字幕形式の調整、表現をより慣用的かつプロフェッショナルに。
- 🎬 バッチビデオ字幕合成をサポートし、処理効率を向上。
- 📝 直感的な字幕編集と表示インターフェース、リアルタイムプレビューと迅速な編集をサポート。
- 🤖 低モデルトークン消費、基本的なLLMモデルを内蔵し、すぐに使用可能。
## 📸 インターフェースプレビュー