| --- |
| language: |
| - jp |
| tags: |
| - つくよみちゃん |
| - StyleBertVITS2 |
| license: "other" |
| --- |
| |
| # Style-Bert-VITS2向けの事前学習モデル |
|
|
|
|
|
|
|  |
|
|
| [Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります |
|
|
| ## 学習データセット |
| * [つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/) |
| * [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) (夢前黎担当部分を許可を得て使用) |
|
|
| ## 学習パラメータ |
| * 最終ステップ数 : 375k step |
| * 学習時間 100 ~ 200時間程度 |
| * bfloat16 : false |
|
|
| ## 学習済みモデル |
|
|
| 学習済みモデルには、pthとsafetensorsの二つをアップロードしています。 |
|
|
| pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました |
|
|
| ## SpeechMOSによる自然性評価 |
|
|
|  |
|
|
| ## loss |
|
|
|  |
|
|
|
|
| # 学習方法 |
| [Style-Bert-VITS2(SBV2)の事前学習モデルを独自データで作成する](https://ayousanz.hatenadiary.jp/entry/2024/02/24/043619) |
|
|
|
|
| # ライセンス |
| * ライセンスは、[つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)に準じます |