Sound Web  - 創造的な楽曲とサウンドを提供する サウンドウェブ -

RVCモデルとRVC Web UIのバージョンとインストール方法

RVCとは

RVCは、Retrieval-based-Voice-Conversionの略で、中国初のAI音声変換モデルです。

まだWikipediaもなく、公式サイトもないようですが、業界では有名らしいです。

公式サイトではないですが、ダウンロードサイトです。

https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
RVCは、汎用的な音声の基盤モデルHuBERT(Hidden Unit BERT))やVITSモデルから派生した音声モデルです。

RVCは一文変換のアーキテクチャでしたが、VCClientや公式のリアルタイム音声変換インターフェースを用いることによってリアルタイムの音声変換を行うことができるようになりました。

RVCの使用についてとバージョンの違い

RVCは、Web UIとして提供されています。

GPUやパソコンやPythonの知識が必要です。

RVC v1

RVCバージョン1は、2023年にリリースされました。

RVC開発者(lj1995)による最初期の公開版で、今は更新停止・保守されていないようです。

バージョン1

RVC v2

RVCバージョン2は、2023年5月にリリースされました。

日本語の発音も良くなったそうです。

RVC-Projectに変わり、継続的に開発・更新されています。

バージョン2

RVCモデルを使う場合に必要なもの

7-Zip

7-Zipをダウンロードします。

RVC WebUI

Hugging FaceからRVC-v1RVC-v2をダウンロードします。

特別なことがなければV2をダウンロードします。

go-web.batで起動できます。

「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」
と出てくる時がありますが、「いいえ」を選択します。


このような画面が起動します。

VCClient

GitHubからVCClientをダウンロードするとbatファイルではなくshファイルしかなかったので、こちらから最新の「vcclient_win_cuda_〇〇beta.zip」ファイルをダウンロードします。

開発者はw-okada氏です。

VCClientは、ダウンロードしたモデルを使って声を変換するものです。

start_https.batで起動させます。

「パブリックネットワークとプライベートネットワークにこのアプリへのアクセスを許可しますか?」
と出てくる時がありますが、「いいえ」を選択します。


このような画面が起動します。

公式マニュアル

仮想オーディオデバイス

VB-CABLE Virtual Audio Deviceをダウンロードします。

仮想オーディオデバイスは、アプリAの出力音声を、アプリBのマイク入力として戻しルーティングすることができるので、RVCなどで変換した声をマイクとして配信に使ったりすることができます。

ダウンロードしたら、VBCABLE_Setup_x64.exeを、管理者として実行しインストール。

Program FilesフォルダにVBフォルダが作られます。

PC再起動します。

RVCモデル

主に



有名なモデル作成者

RVCモデル開発者様を挙げてみます。

はてなボイスルームさん

RVCモデル一覧
凄く丁寧に商品の紹介をされているので好感です。

生ユッケさん

RVCモデル一覧
amazon にて導入方法を公開されています。

twinklemilkyさん

RVCモデル一覧

いみとさん

RVCモデル一覧
声優さんに許可を取っているようなので信頼性があります。

RVCガールズさん

RVCモデル一覧
歌唱系込み、ロり声が強いですね。

sumireyokoさん

RVCモデル一覧
こちらのYoutube のおかげでこの曲を知ることが出来ました。
とても個人的に好きな曲です。ありがとうございます。モデルも拝見させていただきます。

RVCファイルのついて

pth(モデル本体)

PyTorch形式の学習済みモデルファイル(torch.save()で保存されたもの)。

学習済みの音声変換モデルの重み(weights)**が入っている。

RVCのコアとなる変換処理はこのファイルによって行われる。

npy(特徴量ファイル)

NumPy形式で保存された「学習データの特徴ベクトル」。

通常、音声の特徴量(ContentVecなど)を事前に抽出して保存したもの。

推論時の検索効率を高めるために使われる(特にindexと一緒に使う)。

index(FAISSインデック)

npyの特徴量を高速に検索するためのインデックスファイル。

FAISS(Facebook AI Similarity Search) という高速な類似検索ライブラリで作られている。

音声の特徴ベクトルが似ているかどうかを高速に判断し、変換時の精度を上げるために使用。

onnx

ONNX(オンエックス、または「オニックス」と読む)は、「Open Neural Network Exchange」の略で、

異なる深層学習フレームワーク間でモデルをやり取りできるようにするための「共通フォーマット」です。

最後に・・・

今回は
  • RVCとは
  • RVCモデルを使う場合に必要なもの
  • RVCモデル
についてまとめてみました。

最後までお読み頂きありがとうございました。

[カテゴリ]

2025年05月28日

関連記事

ボイスチェンジャーについてやはり、音楽活動や動画制作などの活動をしていると、ど...

2024年05月19日

キャラクターボイスチェンジャーについて前回、ボイスチェンジャーやAIボイスチェン...

2024年05月21日

ボイスのAI生成についてさて、前項で学習されたAIモデルを選んで声を変換するための...

2024年05月22日

VCClientでRVCモデル変換は、入力にオーディオインターフェース...

2025年06月06日

従来は、フリー素材や有料素材などで効果音を利用したりしていましたが、最近では、AIで効果...

2024年11月17日

Copyright© 2015-2026 sound-web.com All Rights Reserbed.

当サイトに掲載している文章、画像などの無断転載を禁止いたします。