From ac0ea24ef93714ef3e02707590e63d05775f35b7 Mon Sep 17 00:00:00 2001
From: Andreas Karatzas <akaratza@amd.com>
Date: Tue, 2 Dec 2025 16:29:18 +0000
Subject: [PATCH 1/3] Added packages used during multi-modal standard model
 testing

Signed-off-by: Andreas Karatzas <akaratza@amd.com>
---
 requirements/rocm-test.txt | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/requirements/rocm-test.txt b/requirements/rocm-test.txt
index ae61d4c6c6a8..509d9e4548e5 100644
--- a/requirements/rocm-test.txt
+++ b/requirements/rocm-test.txt
@@ -83,3 +83,7 @@ pqdm==0.2.0
 arctic-inference == 0.1.1
 # Required for Nemotron test
 open-clip-torch==2.32.0
+# Required for Standard Multi-Modal test
+galileo==1.34.0
+# Required for Qwen-VL test
+qwen-vl-utils==0.0.14

From 124bb4a96349192647431e8f74b66b578af99306 Mon Sep 17 00:00:00 2001
From: Andreas Karatzas <akaratza@amd.com>
Date: Tue, 2 Dec 2025 16:43:54 +0000
Subject: [PATCH 2/3] Removed v1 package copy from final Docker stage

Signed-off-by: Andreas Karatzas <akaratza@amd.com>
---
 docker/Dockerfile.rocm | 6 +-----
 1 file changed, 1 insertion(+), 5 deletions(-)

diff --git a/docker/Dockerfile.rocm b/docker/Dockerfile.rocm
index 4aabe2661088..1b6bdabc7a53 100644
--- a/docker/Dockerfile.rocm
+++ b/docker/Dockerfile.rocm
@@ -65,7 +65,6 @@ COPY --from=build_vllm ${COMMON_WORKDIR}/vllm/tests /tests
 COPY --from=build_vllm ${COMMON_WORKDIR}/vllm/examples /examples
 COPY --from=build_vllm ${COMMON_WORKDIR}/vllm/docker/Dockerfile.rocm /docker/
 COPY --from=build_vllm ${COMMON_WORKDIR}/vllm/.buildkite /.buildkite
-# Centralized v1 package - copied to both test and final stages
 COPY --from=build_vllm ${COMMON_WORKDIR}/vllm/vllm/v1 /vllm_v1
 
 # -----------------------
@@ -98,7 +97,7 @@ RUN --mount=type=cache,target=/root/.cache/uv \
     uv pip install --system hf_transfer
 ENV HF_HUB_ENABLE_HF_TRANSFER=1
 
-# Copy in the v1 package
+# Copy in the v1 package (for python-only install test group)
 COPY --from=export_vllm /vllm_v1 /usr/local/lib/python${PYTHON_VERSION}/dist-packages/vllm/v1
 
 # Source code is used in the `python_only_compile.sh` test
@@ -130,9 +129,6 @@ RUN --mount=type=bind,from=export_vllm,src=/,target=/install \
     && pip uninstall -y vllm \
     && uv pip install --system *.whl
 
-# Copy in the v1 package
-COPY --from=export_vllm /vllm_v1 /usr/local/lib/python${PYTHON_VERSION}/dist-packages/vllm/v1
-
 ARG COMMON_WORKDIR
 
 # Copy over the benchmark scripts as well

From 24175567416f69f517cfcb375e1d8e59cac721af Mon Sep 17 00:00:00 2001
From: Andreas Karatzas <akaratza@amd.com>
Date: Tue, 2 Dec 2025 18:43:31 +0000
Subject: [PATCH 3/3] [ROCm][CI][Bugfix] Disable Flash/MemEfficient SDP on ROCm
 to avoid HF Transformers accuracy issues

Signed-off-by: Andreas Karatzas <akaratza@amd.com>
---
 requirements/rocm-test.txt                    |  8 ++------
 .../models/multimodal/generation/conftest.py  | 19 +++++++++++++++++++
 2 files changed, 21 insertions(+), 6 deletions(-)
 create mode 100644 tests/models/multimodal/generation/conftest.py

diff --git a/requirements/rocm-test.txt b/requirements/rocm-test.txt
index 509d9e4548e5..394728b67eaa 100644
--- a/requirements/rocm-test.txt
+++ b/requirements/rocm-test.txt
@@ -70,8 +70,8 @@ torchgeo==0.7.0
 mteb==2.1.2
 
 # Data processing
-xgrammar @ git+https://github.com/mlc-ai/xgrammar.git@eafd4db51b78acc64b3f0764ef27dfd206c28628
-    # Test async scheduling
+xgrammar==0.1.27
+# Test async scheduling
 
 # Utilities
 num2words==0.5.14
@@ -83,7 +83,3 @@ pqdm==0.2.0
 arctic-inference == 0.1.1
 # Required for Nemotron test
 open-clip-torch==2.32.0
-# Required for Standard Multi-Modal test
-galileo==1.34.0
-# Required for Qwen-VL test
-qwen-vl-utils==0.0.14
diff --git a/tests/models/multimodal/generation/conftest.py b/tests/models/multimodal/generation/conftest.py
new file mode 100644
index 000000000000..ee3ecdb10fdb
--- /dev/null
+++ b/tests/models/multimodal/generation/conftest.py
@@ -0,0 +1,19 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""Pytest configuration for vLLM tests."""
+
+import torch
+
+from vllm.platforms import current_platform
+
+
+def pytest_configure(config):
+    """Disable Flash/MemEfficient SDP on ROCm to avoid HF
+    Transformers accuracy issues.
+    """
+    if not current_platform.is_rocm():
+        return
+
+    torch.backends.cuda.enable_flash_sdp(False)
+    torch.backends.cuda.enable_mem_efficient_sdp(False)
+    torch.backends.cuda.enable_math_sdp(True)