README.md

IPEX-LLM Examples on Intel NPU

This folder contains examples of running IPEX-LLM on Intel NPU:

LLM: examples of running large language models using IPEX-LLM optimizations
- CPP: examples of running large language models using IPEX-LLM optimizations through C++ API
Multimodal: examples of running large multimodal models using IPEX-LLM optimizations
Embedding: examples of running embedding models using IPEX-LLM optimizations
Save-Load: examples of saving and loading low-bit models with IPEX-LLM optimizations

Tip

Please refer to IPEX-LLM NPU Quickstart regarding more information about running ipex-llm on Intel NPU.