ayousanz
/

style-bert-vits2-pretrained-model-ver1

つくよみちゃん

Model card Files Files and versions

style-bert-vits2-pretrained-model-ver1 / README.md

ayousanz's picture

Update README.md

053f3bf verified about 1 year ago

|

History Blame Contribute Delete

1.67 kB

	---
	language:
	- jp
	tags:
	- つくよみちゃん
	- StyleBertVITS2
	license: "other"
	---

	# Style-Bert-VITS2向けの事前学習モデル



	![image/png](https://cdn-uploads.huggingface.co/production/uploads/63ed9019679c2cc40abaf971/HzBDhA0_zQpGLawPpxSur.png)

	[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります

	## 学習データセット
	* [つくよみちゃんコーパス│声優統計コーパス（JVSコーパス準拠）](https://tyc.rei-yumesaki.net/material/corpus/)
	* [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001～BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) （夢前黎担当部分を許可を得て使用）

	## 学習パラメータ
	* 最終ステップ数 : 375k step
	* 学習時間 100 ~ 200時間程度
	* bfloat16 : false

	## 学習済みモデル

	学習済みモデルには、pthとsafetensorsの二つをアップロードしています。

	pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました

	## SpeechMOSによる自然性評価

	![](mos_pretraing.png)

	## loss

	![](image.png)


	# 学習方法
	[Style-Bert-VITS2(SBV2)の事前学習モデルを独自データで作成する](https://ayousanz.hatenadiary.jp/entry/2024/02/24/043619)


	# ライセンス
	* ライセンスは、[つくよみちゃんコーパス│声優統計コーパス（JVSコーパス準拠）](https://tyc.rei-yumesaki.net/material/corpus/)に準じます