Qwen3vl qwen3omni #1982

wenbinc-Bin · 2025-09-25T09:23:29Z

Purpose

Porting qwen3-vl and qwen3-omni to vllm-fork

Test Plan

PT_HPU_LAZY_MODE=1 VLLM_SKIP_WARMUP=true python examples/offline_inference/vision_language.py --modality image --model-type qwen3_vl_moe
PT_HPU_LAZY_MODE=1 VLLM_SKIP_WARMUP=true python examples/offline_inference/vision_language.py --modality video --model-type qwen3_vl_moe
PT_HPU_LAZY_MODE=1 VLLM_SKIP_WARMUP=true python examples/offline_inference/vision_language.py --modality image --model-type qwen3_omni_moe
PT_HPU_LAZY_MODE=1 VLLM_SKIP_WARMUP=true python examples/offline_inference/vision_language.py --modality video --model-type qwen3_omni_moe

Signed-off-by: Roger Wang <[email protected]> Signed-off-by: Isotr0py <[email protected]> Co-authored-by: Huang Jie <[email protected]> Co-authored-by: 松灵 <[email protected]> Co-authored-by: Isotr0py <[email protected]>

Signed-off-by: Chen, Wenbin <[email protected]>

vllm-project#25550 Signed-off-by: Chen, Wenbin <[email protected]>

Signed-off-by: Chen, Wenbin <[email protected]>

Avoid using instance variable when using hpu_graph. Signed-off-by: Chen, Wenbin <[email protected]>

ywang96 and others added 7 commits September 25, 2025 09:20

Support Qwen3-VL Model Series (vllm-project#24727)

d23b757

Signed-off-by: Roger Wang <[email protected]> Signed-off-by: Isotr0py <[email protected]> Co-authored-by: Huang Jie <[email protected]> Co-authored-by: 松灵 <[email protected]> Co-authored-by: Isotr0py <[email protected]>

enable qwen3-vl on gaudi

3778291

Signed-off-by: Chen, Wenbin <[email protected]>

enable qwen3-vl on vision_language.py

812831e

Signed-off-by: Chen, Wenbin <[email protected]>

Add Qwen3-Omni moe thinker (vllm-project#25550)

df7c572

vllm-project#25550 Signed-off-by: Chen, Wenbin <[email protected]>

enable qwen3-omni on gaudi

77b3753

Signed-off-by: Chen, Wenbin <[email protected]>

Enable qwen3-omni in vision_launage.py

72bf664

Signed-off-by: Chen, Wenbin <[email protected]>

Add qwen3-vl qwen3-omni placeholders

03f479b

Signed-off-by: Chen, Wenbin <[email protected]>

wenbinc-Bin requested review from PatrykWo, afierka-intel, jikunshang, kzawora-intel, madamczyk-intel, mgawarkiewicz-intel, michalkuligowski, mswiniarsk, vivekgoe and xuechendi as code owners September 25, 2025 09:23

wenbinc-Bin marked this pull request as draft September 25, 2025 09:23

wenbinc-Bin added 2 commits September 26, 2025 09:34

Fix Qwen3-VL precession bug

4957c40

Avoid using instance variable when using hpu_graph. Signed-off-by: Chen, Wenbin <[email protected]>

Fix qwen3-omni precession bug

53d9351

Avoid using instance variable when using hpu_graph. Signed-off-by: Chen, Wenbin <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Qwen3vl qwen3omni #1982

Qwen3vl qwen3omni #1982

Uh oh!

wenbinc-Bin commented Sep 25, 2025 •

edited by github-actions bot

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Qwen3vl qwen3omni #1982

Are you sure you want to change the base?

Qwen3vl qwen3omni #1982

Uh oh!

Conversation

wenbinc-Bin commented Sep 25, 2025 • edited by github-actions bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Purpose

Test Plan

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

wenbinc-Bin commented Sep 25, 2025 •

edited by github-actions bot

Loading