Loading...

XML

Word

Printable

Type: Bug
Resolution: Done
Priority: Critical
Fix Version/s: RHAIIS-3.2
Affects Version/s: None
Component/s: Accelerator Enablement
Labels:
None

Blocked:
False
Blocked Reason:

Hide

None

Show
None
Ready:
False
Intelligence Requested:
Market:

Sprint:
AIPCC Accelerators 9, AIPCC Accelerators 10

SFDC Cases Links:
SFDC Cases Open:
SFDC Cases Counter:

vLLM v0.9.1 defaults on V0 which has pretty bad accuracy regressions on ROCm.

https://github.com/neuralmagic/nm-cicd/actions/runs/15590090771

Setting VLLM_USE_V1=1 to force using the V1 engine solves the issue

mentioned on

Merge request - Draft: AIPCC-3159: enable VLLM_USE_V1 for ROCm

Solved by commit 21f8ccc53e7da0b5af799aaab0f05e248fd2f9c7.

Assignee:: Daniele Trifirò

Reporter:: Daniele Trifirò

Contributors:: Selbi Nuryyeva

Team:: Frank's Team

Votes:: 0 Vote for this issue

Watchers:: 3 Start watching this issue

Created:: 2025/06/26 4:34 PM

Updated:: 2025/07/10 5:18 AM

Resolved:: 2025/07/10 5:18 AM