AIXI-AIGC
/

OCR_MLLM_TOY

Text Generation

Model card Files Files and versions

OCR_MLLM_TOY / vit_448 /extract_qwen_vl.py

wei01's picture

Upload 7 files

9636619 verified over 2 years ago

History Blame Contribute Delete

701 Bytes

	from transformers import AutoModelForCausalLM
	import torch
	from modelscope import (
	snapshot_download, AutoModelForCausalLM, AutoTokenizer, GenerationConfig
	)
	import torch
	model_id = 'qwen/Qwen-VL-Chat'
	revision = 'v1.0.3'

	model_dir = snapshot_download(model_id, revision=revision)
	model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", trust_remote_code=True, fp16=True).eval()

	state_dict = model.state_dict()
	save_dict = {}
	for k,v in state_dict.items():
	if 'visual' in k:
	if 'transformer.visual.proj' not in k: # we don't need the proj layer
	save_dict[k.replace('transformer.visual.', '')] = v
	torch.save(save_dict, './qwen_clip/pytorch_model.bin')