RVCとは
RVCは、Retrieval-based-Voice-Conversionの略で、中国初のAI音声変換モデルです。まだWikipediaもなく、公式サイトもないようですが、業界では有名らしいです。
公式サイトではないですが、ダウンロードサイトです。
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
RVCは、汎用的な音声の基盤モデルHuBERT(Hidden Unit BERT))やVITSモデルから派生した音声モデルです。
RVCは一文変換のアーキテクチャでしたが、VCClientや公式のリアルタイム音声変換インターフェースを用いることによってリアルタイムの音声変換を行うことができるようになりました。
RVCの使用についてとバージョンの違い
RVCは、Web UIとして提供されています。GPUやパソコンやPythonの知識が必要です。
RVC v1
RVCバージョン1は、2023年にリリースされました。RVC開発者(lj1995)による最初期の公開版で、今は更新停止・保守されていないようです。
バージョン1
RVC v2
RVCバージョン2は、2023年5月にリリースされました。日本語の発音も良くなったそうです。
RVC-Projectに変わり、継続的に開発・更新されています。
バージョン2
RVCモデルを使う場合に必要なもの
7-Zip
7-Zipをダウンロードします。RVC WebUI
Hugging FaceからRVC-v1かRVC-v2をダウンロードします。特別なことがなければV2をダウンロードします。
go-web.batで起動できます。
「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」
と出てくる時がありますが、「いいえ」を選択します。
このような画面が起動します。
VCClient
GitHubからVCClientをダウンロードするとbatファイルではなくshファイルしかなかったので、こちらから最新の「vcclient_win_cuda_〇〇beta.zip」ファイルをダウンロードします。開発者はw-okada氏です。
VCClientは、ダウンロードしたモデルを使って声を変換するものです。
start_https.batで起動させます。
「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」
と出てくる時がありますが、「いいえ」を選択します。
このような画面が起動します。
公式マニュアル
仮想オーディオデバイス
VB-CABLE Virtual Audio Deviceをダウンロードします。仮想オーディオデバイスは、アプリAの出力音声を、アプリBのマイク入力として戻しルーティングすることができるので、RVCなどで変換した声をマイクとして配信に使ったりすることができます。
ダウンロードしたら、VBCABLE_Setup_x64.exeを、管理者として実行しインストール。
Program FilesフォルダにVBフォルダが作られます。
PC再起動します。
RVCモデル
主に有名なモデル作成者
RVCモデル開発者様を挙げてみます。はてなボイスルームさん
RVCモデル一覧凄く丁寧に商品の紹介をされているので好感です。
生ユッケさん
RVCモデル一覧amazon にて導入方法を公開されています。
twinklemilkyさん
RVCモデル一覧いみとさん
RVCモデル一覧声優さんに許可を取っているようなので信頼性があります。
RVCガールズさん
RVCモデル一覧歌唱系込み、ロり声が強いですね。
sumireyokoさん
RVCモデル一覧こちらのYoutube のおかげでこの曲を知ることが出来ました。
とても個人的に好きな曲です。ありがとうございます。モデルも拝見させていただきます。
RVCファイルのついて
pth(モデル本体)
PyTorch形式の学習済みモデルファイル(torch.save()で保存されたもの)。学習済みの音声変換モデルの重み(weights)**が入っている。
RVCのコアとなる変換処理はこのファイルによって行われる。
npy(特徴量ファイル)
NumPy形式で保存された「学習データの特徴ベクトル」。通常、音声の特徴量(ContentVecなど)を事前に抽出して保存したもの。
推論時の検索効率を高めるために使われる(特にindexと一緒に使う)。
index(FAISSインデック)
npyの特徴量を高速に検索するためのインデックスファイル。FAISS(Facebook AI Similarity Search) という高速な類似検索ライブラリで作られている。
音声の特徴ベクトルが似ているかどうかを高速に判断し、変換時の精度を上げるために使用。
onnx
ONNX(オンエックス、または「オニックス」と読む)は、「Open Neural Network Exchange」の略で、異なる深層学習フレームワーク間でモデルをやり取りできるようにするための「共通フォーマット」です。
最後に・・・
今回は- RVCとは
- RVCモデルを使う場合に必要なもの
- RVCモデル
最後までお読み頂きありがとうございました。
[カテゴリ]
2025年05月28日