Releases · huggingface/optimum-intel

25 Apr 08:09

echarlaix

v1.16.1

6c65afd

v1.16.1: Patch release

Bump transformers version by @echarlaix in #682

Contributors

echarlaix

Assets 2

25 Mar 11:56

echarlaix

v1.16.0

d2e35ff

v1.16.0: OpenVINO config, SD hybrid quantization

Add hybrid quantization for Stable Diffusion pipelines by @l-bat in #584

from optimum.intel import OVStableDiffusionPipeline, OVWeightQuantizationConfig

model_id = "echarlaix/stable-diffusion-v1-5-openvino"
quantization_config = OVWeightQuantizationConfig(bits=8, dataset="conceptual_captions")
model = OVStableDiffusionPipeline.from_pretrained(model_id, quantization_config=quantization_config)

Add openvino export configs by @eaidova in #568

Enabling OpenVINO export for the following architectures enabled : Mixtral, ChatGLM, Baichuan, MiniCPM, Qwen, Qwen2, StableLM

Add support for export and inference for StarCoder2 models by @eaidova in #619

Contributors

l-bat and eaidova

Assets 2

22 Feb 17:20

echarlaix

v1.15.2

00f449c

v1.15.2: Patch release

Fix compatibility for transformers>=4.38.0 by @echarlaix in #570

Contributors

echarlaix

Assets 2

21 Feb 15:29

echarlaix

v1.15.1

b96d8fc

v1.15.1: Patch release

Relax dependency on accelerate and datasets in OVQuantizer by @eaidova in #547
Disable compilation before applying 4-bit weight compression by @AlexKoff88 in #569
Update Transformers dependency requirements by @echarlaix in #571

Contributors

AlexKoff88, eaidova, and echarlaix

Assets 2

19 Feb 17:53

echarlaix

v1.15.0

9c83b77

v1.15.0: OpenVINO Tokenizers, quantization configuration

Add OpenVINO Tokenizers by @apaniukov #513
Introduce the OpenVINO quantization configuration by @AlexKoff88 #538
Enable model OpenVINO export by @echarlaix in #557

from diffusers import StableDiffusionPipeline
from optimum.exporters.openvino import export_from_model

model_id = "runwayml/stable-diffusion-v1-5"
model = StableDiffusionPipeline.from_pretrained(model_id)

export_from_model(model, output="ov_model", task="stable-diffusion")

Contributors

AlexKoff88, apaniukov, and echarlaix

Assets 2

31 Jan 17:15

echarlaix

v1.14.0

e194ee2

v1.14.0: IPEX models

IPEX models

from optimum.intel import IPEXModelForCausalLM
from transformers import AutoTokenizer, pipeline

model_id = "Intel/q8_starcoder"
model = IPEXModelForCausalLM.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
results = pipe("He's a dreadful magician and")

Add IPEX models by @echarlaix in #516 / #534 / #536
Add IPEX models by @ofirzaf in #542 / #543 / #544

Fixes

Fix position_ids initialization for first inference of stateful models by @eaidova in #532
Relax requirements to have registered normalized config for decoder models #537 by @eaidova in #537

Contributors

ofirzaf, eaidova, and echarlaix

Assets 2

25 Jan 16:48

echarlaix

v1.13.0

238c0a4

v1.13.0: 4-bit quantization, stateful models, Whisper

OpenVINO

Weight only 4-bit quantization

Add weight only 4-bit quantization support by @AlexKoff88 in #469

optimum-cli export openvino --model gpt2 --weight-format int4_sym_g128 ov_model

Stateful

Add support for stateful models by @eaidova in #493

New architectures

Whisper

Add support for export and inference for whisper models by @eaidova in #470

Contributors

AlexKoff88 and eaidova

Assets 2

22 Jan 14:08

echarlaix

v1.12.4

a2c488c

v1.12.4: Patch release

Fix compatibility with transformers v4.37.0 by @echarlaix in #515
Fix compatibility with transformers v4.37.0 by @echarlaix in #527

Contributors

echarlaix

Assets 2

04 Jan 17:25

echarlaix

v1.12.3

9d07702

v1.12.3: Patch release

Fix compatibility with diffusers v0.25.0 by @eaidova in #497
Modify minimum required transformers version by @echarlaix in #498

Contributors

eaidova and echarlaix

Assets 2

14 Dec 19:48

echarlaix

v1.12.2

6aa0140

v1.12.2: Patch release

Fix compatibility with timm latest release by @echarlaix in #482
Fix causallm weights compression via quantizer by @eaidova #484
Fix pkv dtype by @jiqing-feng #481
Fix compatibility causallm models export with optimum 1.15 by @eaidova #487
Fix trainer compatibility with transformers>=4.36.0 by @echarlaix #490
Fix openvino export by @eaidova #470
Fix INC quantized model loading by @echarlaix #492

Contributors

eaidova, echarlaix, and jiqing-feng

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Contributors

Contributors

Contributors

Contributors

Contributors

IPEX models

Fixes

Contributors

OpenVINO

Weight only 4-bit quantization

Stateful

New architectures

Whisper

Contributors

Contributors

Contributors

Contributors

Releases: huggingface/optimum-intel

v1.16.1: Patch release

Contributors

v1.16.0: OpenVINO config, SD hybrid quantization

Contributors

v1.15.2: Patch release

Contributors

v1.15.1: Patch release

Contributors

v1.15.0: OpenVINO Tokenizers, quantization configuration

Contributors

v1.14.0: IPEX models

IPEX models

Fixes

Contributors

v1.13.0: 4-bit quantization, stateful models, Whisper

OpenVINO

Weight only 4-bit quantization

Stateful

New architectures

Whisper

Contributors

v1.12.4: Patch release

Contributors

v1.12.3: Patch release

Contributors

v1.12.2: Patch release

Contributors