具有实时支持和大大改进界面的so-vits-svc的分支。基于分支 (v1) 和模型兼容。
4.0
快速VC
ContentVec
的误用。1
CREPE
进行更准确的螺距估算。pip
fairseq
此 BAT 文件将自动执行下述步骤。
窗户:
py -3.10 -m venv venv
venv\Scripts\activate
Linux/MacOS:
python3.10 -m venv venv
source venv/bin/activate
anaconda :
conda create -n so-vits-svc-fork python=3.10 pip
conda activate so-vits-svc-fork
如果在程序文件中安装了 Python 等,则在不创建虚拟环境的情况下安装可能会导致 Python。
PermissionError
通过 pip(或你最喜欢的使用 pip 的包管理器)安装它:
python -m pip install -U pip setuptools wheel
pip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -U so-vits-svc-fork
pip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu118
--index-url https://download.pytorch.org/whl/cu118
--index-url https://download.pytorch.org/whl/rocm5.4.2
请定期更新此软件包以获取最新功能和错误修复。
pip install -U so-vits-svc-fork
GUI 使用以下命令启动:
svcg
svc vc
svc infer source.wav
预训练模型可在Hugging Face或CIVITAI上使用。
3_HP-Vocal-UVR.pth
UVR-MDX-NET Main
svc pre-split
librosa
svc pre-sd
pyannote.audio
pyannote.audio
pip install pyannote-audio
svc pre-classify
如果你无法访问VRAM超过10 GB的GPU,则建议轻度用户使用Google Colab的免费计划,对于重度用户,建议使用Paperspace的Pro/Growth计划。相反,如果你可以访问高端 GPU,则不建议使用云服务。
放置数据集,例如(子文件夹和非ASCII文件名是可以接受的),然后运行:
dataset_raw/{speaker_id}/**/{wav_file}.{any_format}
svc pre-resample
svc pre-config
svc pre-hubert
svc train -t
batch_size
config.json
train
batch_size
auto-{init_batch_size}-{max_n_trials}
auto
batch_size
CREPE
svc pre-hubert
svc pre-hubert -fm crepe
ContentVec
svc pre-config
-t so-vits-svc-4.0v1
MS-iSTFT Decoder
svc pre-config
svc pre-config -t quickvc
有关更多详细信息,请运行 或 。
svc -h
svc <subcommand> -h
> svc -h
Usage: svc [OPTIONS] COMMAND [ARGS]...
so-vits-svc allows any folder structure for training data.
However, the following folder structure is recommended.
When training: dataset_raw/{speaker_name}/**/{wav_name}.{any_format}
When inference: configs/44k/config.json, logs/44k/G_XXXX.pth
If the folder structure is followed, you DO NOT NEED TO SPECIFY model path, config path, etc.
(The latest model will be automatically loaded.)
To train a model, run pre-resample, pre-config, pre-hubert, train.
To infer a model, run infer.
Options:
-h, --help Show this message and exit.
Commands:
clean Clean up files, only useful if you are using the default file structure
infer Inference
onnx Export model to onnx (currently not working)
pre-classify Classify multiple audio files into multiple files
pre-config Preprocessing part 2: config
pre-hubert Preprocessing part 3: hubert If the HuBERT model is not found, it will be...
pre-resample Preprocessing part 1: resample
pre-sd Speech diarization using pyannote.audio
pre-split Split audio files into multiple files
train Train model If D_0.pth or G_0.pth not found, automatically download from hub.
train-cluster Train k-means clustering
vc Realtime inference from microphone
感谢这些很棒的人(表情符号键):
34焦耳 |
加勒特康威 |
蓝色护身符 |
一次性账户01 |
緋 |
洛德毛5 |
DL909 |
满意256 |
皮耶路易吉·扎加里亚 |
鲁库斯马特斯特 |
德冢艺术 |
heyfixit |
书啮齿动物 |
谢宇 |
冷考菲 |
斯伯西尔 |
梅尔多纳 |
莫德亚瑟 |
阿隆丹 |
利克兹 |
胶带游戏 |
何 |
75奥苏 |
托尼科82 |
yxlllc |
出嗝 |
埃斯库里奥因格莱西亚斯 |
布莱克辛格 |
M.托伊布·安塔努萨 |
埃克斯菲尔 |
古拉农 |
亚历山大·库米斯 |
醋甲上 |
海乌佩奇 |
天蝎座 |
马克西姆克斯 |
此项目遵循所有贡献者规范。欢迎任何形式的贡献!