ybelkada
/

bloom-1b7-8bit

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

ybelkada commited on Mar 31, 2023

Commit

76081f9

·

1 Parent(s): e88a7eb

Upload BloomForCausalLM

Files changed (1) hide show

config.json +8 -0

config.json CHANGED Viewed

@@ -21,6 +21,14 @@
   "offset_alibi": 100,
   "pad_token_id": 3,
   "pretraining_tp": 2,
   "seq_length": 4096,
   "skip_bias_add": true,
   "skip_bias_add_qkv": false,

   "offset_alibi": 100,
   "pad_token_id": 3,
   "pretraining_tp": 2,
+  "quantization_config": {
+    "_from_model_config": false,
+    "llm_int8_enable_fp32_cpu_offload": false,
+    "llm_int8_skip_modules": null,
+    "llm_int8_threshold": 6.0,
+    "load_in_8bit": true,
+    "transformers_version": "4.28.0.dev0"
+  },
   "seq_length": 4096,
   "skip_bias_add": true,
   "skip_bias_add_qkv": false,