lukasz-staniszewski
/

audioldm2-caa-vocal-gender

@@ -7,15 +7,15 @@ tags:
   - audioldm2
   - caa
   - diffusion
-  - female-vocals
   - interpretability
   - music
   - steering
 ---
-# CAA — `female_vocals` (AudioLDM2)
-Steering vectors for the **female_vocals** concept on AudioLDM2, computed via contrastive activation addition (CAA).
 ## Quickstart
@@ -23,7 +23,7 @@ Steering vectors for the **female_vocals** concept on AudioLDM2, computed via co
 from src.steering import SteerableAudioLDMModel, AudioLDMCAASteeringController
 model = SteerableAudioLDMModel(device="cuda")
-ctrl = AudioLDMCAASteeringController.from_pretrained("lukasz-staniszewski/audioldm2-caa-female-vocals", alpha=1.0)
 with model.steer(ctrl):
     out = model.generate(
@@ -39,7 +39,7 @@ with model.steer(ctrl):
 {
   "method": "standard_caa_audioldm",
   "model": "cvssp/audioldm2-large",
-  "concept": "female_vocals",
   "num_inference_steps": 100,
   "audio_length_in_s": 10.0,
   "guidance_scale": 4.5,

   - audioldm2
   - caa
   - diffusion
   - interpretability
   - music
   - steering
+  - vocal-gender
 ---
+# CAA — `vocal_gender` (AudioLDM2)
+Steering vectors for the **vocal_gender** concept on AudioLDM2, computed via contrastive activation addition (CAA).
 ## Quickstart
 from src.steering import SteerableAudioLDMModel, AudioLDMCAASteeringController
 model = SteerableAudioLDMModel(device="cuda")
+ctrl = AudioLDMCAASteeringController.from_pretrained("lukasz-staniszewski/audioldm2-caa-vocal-gender", alpha=1.0)
 with model.steer(ctrl):
     out = model.generate(
 {
   "method": "standard_caa_audioldm",
   "model": "cvssp/audioldm2-large",
+  "concept": "vocal_gender",
   "num_inference_steps": 100,
   "audio_length_in_s": 10.0,
   "guidance_scale": 4.5,