[release-4.20] OCPBUGS-62273: Fix EgressIP stale GARP post reboot + pod restart #2767

martinkennelly · 2025-09-29T11:20:35Z

/hold

Currently, we are force exiting with the trap before the background processes can end, container is removed and the orphaned processes end early causing our config to go into an unknown state because we dont end in an orderly manner. Wait until the pid file for ovnkube controller with node is removed which shows the process has completed. Signed-off-by: Martin Kennelly <[email protected]> (cherry picked from commit 8b29419)

Prevent ovn-controller from sending stale GARP by adding drop flows on external bridge patch ports until ovnkube-controller synchronizes the southbound database - henceforth known as "drop flows". This addresses race conditions where ovn-controller processes outdated SB DB state before ovnkube-controller updates it, particularly affecting EIP SNAT configurations attached to logical router ports. Fixes: https://issues.redhat.com/browse/FDP-1537 ovnkube-controller controls the lifecycle of the drop flows. ovs / ovn-controller running is required to configure external bridge. Downstream, the external bridge maybe precreated and ovn-controller will use this. This fix considers three primary scenarios: node, container and pod restart. On Node restart means the ovs flows installed priotior to reboot on the node are cleared but the external bridge exists. Add the flows before ovnkube controller with node starts. The reason to add it here is that our gateway code depends on ovn-controller started and running... There is now a race here between ovn-controller starting (and garping) before we set this flow but I think the risk is low however it needs serious testing. The reason I did not naturally at the drop flows before ovn-controller started is because I have no way to detect if its a node reboot or pod reboot and i dont want to inject drop flows for simple ovn-controller container restart which could disrupt traffic. ovnkube-controller starts, we create a new gateway and apply flows the same flows in-order to ensure we always drop GARP when ovnkube controller hasn't sync. Remove the flows when ovnkube-controller has syncd. There is also a race here between ovnkube-controller removing the flows and ovn-controller GARPing with stale SB DB info. There is no easy way to detect what SB DB data ovn-controller has consumed. On Pod restart, we add the drop flows before exit. ovnkube-controller-with-node will also add it before it starts the go code. Container restart: - ovnkube-controller: adds flows upon start and exit - ovn-controller: no changes While the drop flows are set, OVN may not be able to resolve IPs it doesn't know about in its Logical Router pipelines generation. Following removal of the drop flows, OVN may resolve the IPs using GARP requests. OVN-Controller always sends out GARPs with op code 1 on startup. Signed-off-by: Martin Kennelly <[email protected]> (cherry picked from commit 82fc3bf)

PR 5373 to drop the GARP flows didnt consider that we set the default network controller and later we set the gateway obj. In-between this period, ovnkube node may receive a stop signal and we do not guard against accessing the gateway if its not yet set. OVNKube controller may have sync'd before the gateway obj is set. There is nothing to reconcile if the gateway is not set. Signed-off-by: Martin Kennelly <[email protected]> (cherry picked from commit e60220a)

openshift-ci-robot · 2025-09-29T11:20:45Z

@martinkennelly: This pull request references Jira Issue OCPBUGS-62273, which is invalid:

release note text must be set and not match the template OR release note type must be set to "Release Note Not Required". For more information you can reference the OpenShift Bug Process.
expected dependent Jira Issue OCPBUGS-42303 to be in one of the following states: MODIFIED, ON_QA, VERIFIED, but it is POST instead

Comment /jira refresh to re-evaluate validity if changes to the Jira bug are made, or edit the title of this pull request to link to a different bug.

The bug has been updated to refer to the pull request using the external bug tracker.

In response to this:

/hold

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the openshift-eng/jira-lifecycle-plugin repository.

martinkennelly · 2025-10-01T08:47:33Z

/retest

martinkennelly · 2025-10-01T08:50:31Z

/payload 4.20 ci blocking
/payload 4.20 nightly blocking

openshift-ci · 2025-10-01T08:50:35Z

@martinkennelly: trigger 5 job(s) of type blocking for the ci release of OCP 4.20

periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-azure-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aks
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aws-ovn

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/aff1c280-9ea3-11f0-9d4a-b7774b550ef6-0

trigger 10 job(s) of type blocking for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-ci-4.20-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upgrade-fips
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aws-ovn-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-bm
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/aff1c280-9ea3-11f0-9d4a-b7774b550ef6-1

openshift-ci · 2025-10-01T08:58:16Z

@martinkennelly: This PR was included in a payload test run from openshift/machine-config-operator#5317
trigger 10 job(s) of type blocking for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-ci-4.20-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upgrade-fips
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aws-ovn-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-bm
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/c1411b20-9ea4-11f0-832b-31e3f9e7c09d-0

openshift-ci · 2025-10-01T08:58:43Z

@martinkennelly: This PR was included in a payload test run from openshift/machine-config-operator#5317
trigger 67 job(s) of type informing for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-compact-fips
periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-ha-dualstack-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-single-node-ipv6-conformance
periodic-ci-openshift-release-master-nightly-4.20-console-aws
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-aws
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-csi
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-cgroupsv2
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-fips
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-upgrade-out-of-change
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upi
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-azure
periodic-ci-openshift-release-master-nightly-4.20-e2e-azure-csi
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade-out-of-change
periodic-ci-openshift-release-master-cnv-nightly-4.20-deploy-azure-kubevirt-ovn
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-gcp
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-rt
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-azure-kubevirt-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-dualstack
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-dualstack-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-ipv4
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-virtualmedia-1of2
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-virtualmedia-2of2
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-metal-ipi-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-serial-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-serial-ovn-dualstack
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-upgrade-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-metal-ipi-upgrade-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-metal-ovn-single-node-recert-cluster-rename
periodic-ci-openshift-osde2e-main-nightly-4.20-osd-aws
periodic-ci-openshift-release-master-nightly-4.20-e2e-osd-ccs-gcp
periodic-ci-openshift-osde2e-main-nightly-4.20-osd-gcp
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-proxy
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ovn-single-node-live-iso
periodic-ci-openshift-eng-ocp-qe-perfscale-ci-main-aws-4.20-nightly-x86-payload-control-plane-6nodes
periodic-ci-openshift-release-master-nightly-4.20-e2e-telco5g
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-vsphere-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-vsphere-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-upi
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-upi-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-static-ovn

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/d08c34c0-9ea4-11f0-9135-f805ed0e2cd9-0

martinkennelly · 2025-10-02T08:41:48Z

/test e2e-gcp-ovn-techpreview

Disruption seen:

time="2025-10-01T11:35:11Z" level=info msg="calculated total disruption" backend="{service-load-balancer-with-pdb-new-connections 0 0 0 2.5 3 51 lightgreen}"
time="2025-10-01T11:35:11Z" level=info msg="searching for bestMatch for {Release:4.20 FromRelease: Platform:gcp Architecture:amd64 Network:ovn Topology:ha}" backend=gcp-network-liveness-new-connections
time="2025-10-01T11:35:11Z" level=info msg="historicalData has 7634 entries"
time="2025-10-01T11:35:11Z" level=info msg="found exact match: {DataKey:{BackendName:gcp-network-liveness-new-connections JobType:{Release:4.20 FromRelease: Platform:gcp Architecture:amd64 Network:ovn Topology:ha}} P50:0 P75:0 P95:5.5 P99:316.5 FirstObserved:0001-01-01 00:00:00 +0000 UTC LastObserved:0001-01-01 00:00:00 +0000 UTC JobRuns:51}"
time="2025-10-01T11:35:11Z" level=info msg="calculated total disruption" backend="{gcp-network-liveness-new-connections 0 0 0 5.5 316.5 51 lightgreen}"
time="2025-10-01T11:35:11Z" level=info msg="searching for bestMatch for {Release:4.20 FromRelease: Platform:gcp Architecture:amd64 Network:ovn Topology:ha}" backend=host-to-host-reused-connections
time="2025-10-01T11:35:11Z" level=info msg="historicalData has 7634 entries"
time="2025-10-01T11:35:11Z" level=info msg="found exact match: {DataKey:{BackendName:host-to-host-reused-connections JobType:{Release:4.20 FromRelease: Platform:gcp Architecture:amd64 Network:ovn Topology:ha}} P50:0 P75:0 P95:0 P99:0 FirstObserved:0001-01-01 00:00:00 +0000 UTC LastObserved:0001-01-01 00:00:00 +0000 UTC JobRuns:51}"
time="2025-10-01T11:35:11Z" level=info msg="calculated total disruption" backend="{host-to-host-reused-connections 0 0 0 0 0 51 lightgreen}"

martinkennelly · 2025-10-02T08:42:25Z

Lint maybe overridden https://issues.redhat.com/browse/CORENET-6207

openshift-ci · 2025-10-02T11:44:00Z

@martinkennelly: This PR was included in a payload test run from openshift/machine-config-operator#5317
trigger 10 job(s) of type blocking for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-ci-4.20-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upgrade-fips
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aws-ovn-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-bm
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/13c8aa30-9f85-11f0-8f90-4690ab5934ee-0

martinkennelly · 2025-10-02T16:16:26Z

/test e2e-gcp-ovn-techpreview

 [sig-network] Conntrack should be able to preserve UDP traffic when server pod cycles for a ClusterIP service with InternalTrafficPolicy set to Local [Suite:openshift/conformance/parallel] [Suite:k8s]

https://issues.redhat.com/browse/OCPBUGS-61506

Ensure ovn-controller has processed the SB DB updates before removing the GARP drop flows by utilizing the hv_cfg field in NB_Global [1] OVNKube controller increments the nb_cfg value post sync, which is copied to SB DB by northd. OVN-Controllers copy this nb_cfg value from SB DB and write it to their chassis_private tables nb_cfg field after they have processed the SB DB changes. Northd will then look at all the chassis_private tables nb_cfg value and set the NB DBs Nb_global hv_cfg value to the min integer found. Since IC currently only supports one node per zone, we can be sure ovn-controller is running locally and therefore its ok to block removing the drop GARP flows. [1] https://man7.org/linux/man-pages/man5/ovn-nb.5.html Signed-off-by: Martin Kennelly <[email protected]> (cherry picked from commit 3b5da01)

openshift-ci · 2025-10-08T11:52:23Z

@martinkennelly: This PR was included in a payload test run from openshift/machine-config-operator#5317
trigger 10 job(s) of type blocking for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-ci-4.20-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upgrade-fips
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-aws-ovn-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-bm
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/3c9dcbe0-a43d-11f0-8492-d57d926fbb48-0

openshift-ci · 2025-10-08T11:53:11Z

@martinkennelly: This PR was included in a payload test run from openshift/machine-config-operator#5317
trigger 67 job(s) of type informing for the nightly release of OCP 4.20

periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-compact-fips
periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-ha-dualstack-conformance
periodic-ci-openshift-release-master-nightly-4.20-e2e-agent-single-node-ipv6-conformance
periodic-ci-openshift-release-master-nightly-4.20-console-aws
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-aws
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-csi
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-cgroupsv2
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-fips
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-single-node-techpreview-serial
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-aws-upgrade-ovn-single-node
periodic-ci-openshift-release-master-ci-4.20-e2e-aws-ovn-upgrade-out-of-change
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-upi
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-azure
periodic-ci-openshift-release-master-nightly-4.20-e2e-azure-csi
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-azure-ovn-upgrade-out-of-change
periodic-ci-openshift-release-master-cnv-nightly-4.20-deploy-azure-kubevirt-ovn
periodic-ci-openshift-cluster-control-plane-machine-set-operator-release-4.20-periodics-e2e-gcp
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-rt
periodic-ci-openshift-release-master-nightly-4.20-e2e-gcp-ovn-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-techpreview
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-e2e-gcp-ovn-upgrade
periodic-ci-openshift-hypershift-release-4.20-periodics-e2e-azure-kubevirt-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-dualstack
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-dualstack-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-ipv6-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-ipv4
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-virtualmedia-1of2
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-serial-virtualmedia-2of2
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-metal-ipi-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-serial-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-serial-ovn-dualstack
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ipi-upgrade-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-upgrade-from-stable-4.19-e2e-metal-ipi-upgrade-ovn-ipv6
periodic-ci-openshift-release-master-nightly-4.20-metal-ovn-single-node-recert-cluster-rename
periodic-ci-openshift-osde2e-main-nightly-4.20-osd-aws
periodic-ci-openshift-release-master-nightly-4.20-e2e-osd-ccs-gcp
periodic-ci-openshift-osde2e-main-nightly-4.20-osd-gcp
periodic-ci-openshift-release-master-nightly-4.20-e2e-aws-ovn-proxy
periodic-ci-openshift-release-master-nightly-4.20-e2e-metal-ovn-single-node-live-iso
periodic-ci-openshift-eng-ocp-qe-perfscale-ci-main-aws-4.20-nightly-x86-payload-control-plane-6nodes
periodic-ci-openshift-release-master-nightly-4.20-e2e-telco5g
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-csi
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-techpreview
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-techpreview-serial
periodic-ci-openshift-release-master-ci-4.20-e2e-vsphere-ovn-upgrade
periodic-ci-openshift-release-master-ci-4.20-upgrade-from-stable-4.19-e2e-vsphere-ovn-upgrade
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-upi
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-ovn-upi-serial
periodic-ci-openshift-release-master-nightly-4.20-e2e-vsphere-static-ovn

See details on https://pr-payload-tests.ci.openshift.org/runs/ci/5a2d3d80-a43d-11f0-8069-b32b778be59b-0

martinkennelly · 2025-10-08T16:47:10Z

/test e2e-aws-ovn-local-to-shared-gateway-mode-migration

Known issue:

[sig-network] Conntrack should be able to preserve UDP traffic when server pod cycles for a NodePort service [Suite:openshift/conformance/parallel] [Suite:k8s]

https://issues.redhat.com/browse/OCPBUGS-59496

martinkennelly · 2025-10-08T16:50:28Z

/test e2e-aws-ovn-upgrade

Unrelated - couldnt find a bug.

[sig-autoscaling] [Feature:HPA] Horizontal pod autoscaling (scale resource: CPU) CustomResourceDefinition Should scale with a CRD targetRef [Suite:openshift/conformance/parallel] [Suite:k8s] expand_less	1m39s
{  fail [k8s.io/kubernetes/test/e2e/autoscaling/horizontal_pod_autoscaling.go:211]: timeout waiting 15m0s for 2 replicas: Told to stop trying after 60.085s.
Unexpected final error while getting int: Operation cannot be fulfilled on testcrds.autoscalinge2e.example.com "foo-crd": the object has been modified; please apply your changes to the latest version and try again
At one point, however, the function did return successfully.
Yet, Eventually failed because the matcher was not satisfied:
Expected
    <int>: 1
to equal
    <int>: 2}

martinkennelly · 2025-10-08T16:53:22Z

/test e2e-azure-ovn-upgrade
Unrelated - couldnt find a bug.

sig-api-machinery][Feature:APIServer] API LBs follow /readyz of kube-apiserver and stop sending requests before server shutdowns for external clients expand_less	0s
{The following requests arrived when apiserver was gracefully shutting down:
ec1eb02c-29d2-4911-ac54-394a05cfdd46  more details in audit log}

martinkennelly · 2025-10-08T16:57:18Z

/test e2e-gcp-ovn

: [sig-network] LoadBalancers [Feature:LoadBalancer] should be able to preserve UDP traffic when server pod cycles for a LoadBalancer service on the same nodes [Suite:openshift/conformance/parallel] [Suite:k8s] expand_less	2m32s
{  fail [k8s.io/kubernetes/test/e2e/network/loadbalancer.go:940]: Failed to connect to backend 1}

Same error sig outside this PR:

https://search.dptools.openshift.org/?search=should+be+able+to+preserve+UDP+traffic+when+server+pod+cycles+for+a+LoadBalancer+service+on+the+same+nodes+&maxAge=48h&context=1&type=bug%2Bissue%2Bjunit&name=&excludeName=&maxMatches=5&maxBytes=20971520&groupBy=job

Also deprovisioning failed:

{"component":"entrypoint","file":"sigs.k8s.io/prow/pkg/entrypoint/run.go:169","func":"sigs.k8s.io/prow/pkg/entrypoint.Options.ExecuteProcess","level":"error","msg":"Process did not finish before 1h0m0s timeout","severity":"error","time":"2025-10-08T16:13:47Z"}
Copying the Installer logs and metadata to the artifacts directory...
{"component":"entrypoint","file":"sigs.k8s.io/prow/pkg/entrypoint/run.go:267","func":"sigs.k8s.io/prow/pkg/entrypoint.gracefullyTerminate","level":"error","msg":"Process did not exit before 10m0s grace period","severity":"error","time":"2025-10-08T16:23:47Z"}
{"component":"entrypoint","error":"os: process already finished","file":"sigs.k8s.io/prow/pkg/entrypoint/run.go:269","func":"sigs.k8s.io/prow/pkg/entrypoint.gracefullyTerminate","level":"error","msg":"Could not kill process after grace period","severity":"error","time":"2025-10-08T16:23:47Z"}
{"component":"entrypoint","error":"process timed out","file":"sigs.k8s.io/prow/pkg/entrypoint/run.go:84","func":"sigs.k8s.io/prow/pkg/entrypoint.Options.internalRun","level":"error","msg":"Error executing test process","severity":"error","time":"2025-10-08T16:23:47Z"}
error: failed to execute wrapped command: exit status 127
}

Theres are unrelated to this PR

martinkennelly · 2025-10-08T17:00:46Z

/test e2e-gcp-ovn-techpreview

Unrelated - no bug found:

 [sig-network-edge][Feature:Idling] Idling with a single service and ReplicationController should idle the service and ReplicationController properly [Suite:openshift/conformance/parallel] expand_less
Run #0: Failed expand_less	11s
{  fail [github.com/openshift/origin/test/extended/idling/idling.go:129]: Failed after 3.476s.
Expected
    <string>: "2"
to contain substring
    <string>: 0}

openshift-ci · 2025-10-10T09:15:48Z

[APPROVALNOTIFIER] This PR is APPROVED

This pull-request has been approved by: jcaamano, martinkennelly

The full list of commands accepted by this bot can be found here.

The pull request process is described here

Needs approval from an approver in each of these files:

~~OWNERS~~ [jcaamano,martinkennelly]

Approvers can indicate their approval by writing /approve in a comment
Approvers can cancel approval by writing /approve cancel in a comment

martinkennelly · 2025-10-10T09:51:13Z

/jira refresh

openshift-ci-robot · 2025-10-10T09:51:19Z

@martinkennelly: This pull request references Jira Issue OCPBUGS-62273, which is invalid:

expected dependent Jira Issue OCPBUGS-62670 to be in one of the following states: MODIFIED, ON_QA, VERIFIED, but it is ASSIGNED instead
expected dependent Jira Issue OCPBUGS-62670 to target a version in 4.21.0, but it targets "4.19.z" instead

Comment /jira refresh to re-evaluate validity if changes to the Jira bug are made, or edit the title of this pull request to link to a different bug.

In response to this:

/jira refresh

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the openshift-eng/jira-lifecycle-plugin repository.

martinkennelly · 2025-10-10T09:54:01Z

/jira refresh

openshift-ci-robot · 2025-10-10T09:54:06Z

@martinkennelly: This pull request references Jira Issue OCPBUGS-62273, which is invalid:

expected dependent Jira Issue OCPBUGS-62670 to be in one of the following states: MODIFIED, ON_QA, VERIFIED, but it is ASSIGNED instead
expected dependent Jira Issue OCPBUGS-62670 to target a version in 4.21.0, but it targets "4.19.z" instead

Comment /jira refresh to re-evaluate validity if changes to the Jira bug are made, or edit the title of this pull request to link to a different bug.

In response to this:

/jira refresh

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the openshift-eng/jira-lifecycle-plugin repository.

martinkennelly · 2025-10-10T09:59:00Z

/jira refresh

openshift-ci-robot · 2025-10-10T09:59:07Z

@martinkennelly: This pull request references Jira Issue OCPBUGS-62273, which is valid.

9 validation(s) were run on this bug

bug is open, matching expected state (open)
bug target version (4.20.0) matches configured target version for branch (4.20.0)
bug is in the state POST, which is one of the valid states (NEW, ASSIGNED, POST)
release note text is set and does not match the template
dependent bug Jira Issue OCPBUGS-42303 is in the state Verified, which is one of the valid states (MODIFIED, ON_QA, VERIFIED)
dependent bug Jira Issue OCPBUGS-42303 is in the state Verified, which is one of the valid states (MODIFIED, ON_QA, VERIFIED)
dependent Jira Issue OCPBUGS-42303 targets the "4.21.0" version, which is one of the valid target versions: 4.21.0
dependent Jira Issue OCPBUGS-42303 targets the "4.21.0" version, which is one of the valid target versions: 4.21.0
bug has dependents

No GitHub users were found matching the public email listed for the QA contact in Jira ([email protected]), skipping review request.

In response to this:

/jira refresh

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the openshift-eng/jira-lifecycle-plugin repository.

martinkennelly · 2025-10-10T10:43:38Z

Waiting on perf scale team to ack / not ack the CI resules for job qe-perfscale-payload-control-plane-6nodes. Discussion here: https://redhat-internal.slack.com/archives/CU9HKBZKJ/p1759941599018259

martinkennelly · 2025-10-10T11:36:42Z

https://redhat-internal.slack.com/archives/CU9HKBZKJ/p1760094600057189?thread_ts=1759941599.018259&cid=CU9HKBZKJ

@jcaamano ^ they said its nothing to do with my PR.

jtaleric · 2025-10-10T11:56:31Z

/test

openshift-ci · 2025-10-10T11:56:35Z

@jtaleric: The /test command needs one or more targets.
The following commands are available to trigger required jobs:

/test 4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade

/test 4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade

/test 4.20-upgrade-from-stable-4.19-images

/test e2e-aws-ovn

/test e2e-aws-ovn-edge-zones

/test e2e-aws-ovn-hypershift

/test e2e-aws-ovn-local-gateway

/test e2e-aws-ovn-local-to-shared-gateway-mode-migration

/test e2e-aws-ovn-serial

/test e2e-aws-ovn-shared-to-local-gateway-mode-migration

/test e2e-aws-ovn-upgrade

/test e2e-aws-ovn-upgrade-local-gateway

/test e2e-aws-ovn-windows

/test e2e-azure-ovn-upgrade

/test e2e-gcp-ovn

/test e2e-gcp-ovn-techpreview

/test e2e-metal-ipi-ovn-dualstack

/test e2e-metal-ipi-ovn-dualstack-bgp

/test e2e-metal-ipi-ovn-dualstack-bgp-local-gw

/test e2e-metal-ipi-ovn-ipv6

/test gofmt

/test images

/test lint

/test okd-scos-images

/test qe-perfscale-payload-control-plane-6nodes

/test unit

The following commands are available to trigger optional jobs:

/test 4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade-ipsec

/test e2e-agent-compact-ipv4

/test e2e-aws-ovn-clusternetwork-cidr-expansion

/test e2e-aws-ovn-fdp-qe

/test e2e-aws-ovn-hypershift-conformance-techpreview

/test e2e-aws-ovn-hypershift-kubevirt

/test e2e-aws-ovn-serial-ipsec

/test e2e-aws-ovn-single-node-techpreview

/test e2e-aws-ovn-techpreview

/test e2e-aws-ovn-upgrade-ipsec

/test e2e-azure-ovn

/test e2e-azure-ovn-techpreview

/test e2e-metal-ipi-ovn-bgp-virt-dualstack

/test e2e-metal-ipi-ovn-bgp-virt-dualstack-techpreview

/test e2e-metal-ipi-ovn-dualstack-local-gateway

/test e2e-metal-ipi-ovn-dualstack-local-gateway-techpreview

/test e2e-metal-ipi-ovn-dualstack-techpreview

/test e2e-metal-ipi-ovn-ipv4

/test e2e-metal-ipi-ovn-ipv6-techpreview

/test e2e-metal-ipi-ovn-techpreview

/test e2e-openstack-ovn

/test e2e-ovn-hybrid-step-registry

/test e2e-vsphere-ovn

/test e2e-vsphere-ovn-techpreview

/test e2e-vsphere-windows

/test okd-scos-e2e-aws-ovn

/test openshift-e2e-gcp-ovn-techpreview-upgrade

/test ovncore-perfscale-aws-ovn-large-cluster-density-v2

/test ovncore-perfscale-aws-ovn-large-node-density-cni

/test ovncore-perfscale-aws-ovn-xlarge-cluster-density-v2

/test ovncore-perfscale-aws-ovn-xlarge-node-density-cni

/test perfscale-aws-ovn-medium-cluster-density-v2

/test perfscale-aws-ovn-medium-node-density-cni

/test perfscale-aws-ovn-small-cluster-density-v2

/test perfscale-aws-ovn-small-node-density-cni

/test qe-perfscale-aws-ovn-small-udn-density-churn-l3

/test qe-perfscale-aws-ovn-small-udn-density-l2

/test qe-perfscale-aws-ovn-small-udn-density-l3

/test security

Use /test all to run the following jobs that were automatically triggered:

pull-ci-openshift-ovn-kubernetes-release-4.20-4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade

pull-ci-openshift-ovn-kubernetes-release-4.20-4.20-upgrade-from-stable-4.19-e2e-aws-ovn-upgrade-ipsec

pull-ci-openshift-ovn-kubernetes-release-4.20-4.20-upgrade-from-stable-4.19-e2e-gcp-ovn-rt-upgrade

pull-ci-openshift-ovn-kubernetes-release-4.20-4.20-upgrade-from-stable-4.19-images

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-edge-zones

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-hypershift

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-local-gateway

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-local-to-shared-gateway-mode-migration

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-serial

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-shared-to-local-gateway-mode-migration

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-upgrade

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-upgrade-local-gateway

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-aws-ovn-windows

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-azure-ovn-upgrade

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-gcp-ovn

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-gcp-ovn-techpreview

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-metal-ipi-ovn-dualstack

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-metal-ipi-ovn-dualstack-bgp

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-metal-ipi-ovn-dualstack-bgp-local-gw

pull-ci-openshift-ovn-kubernetes-release-4.20-e2e-metal-ipi-ovn-ipv6

pull-ci-openshift-ovn-kubernetes-release-4.20-gofmt

pull-ci-openshift-ovn-kubernetes-release-4.20-images

pull-ci-openshift-ovn-kubernetes-release-4.20-lint

pull-ci-openshift-ovn-kubernetes-release-4.20-okd-scos-e2e-aws-ovn

pull-ci-openshift-ovn-kubernetes-release-4.20-okd-scos-images

pull-ci-openshift-ovn-kubernetes-release-4.20-qe-perfscale-payload-control-plane-6nodes

pull-ci-openshift-ovn-kubernetes-release-4.20-security

pull-ci-openshift-ovn-kubernetes-release-4.20-unit

In response to this:

/test

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the kubernetes-sigs/prow repository.

jtaleric · 2025-10-10T11:57:33Z

/test qe-perfscale-payload-control-plane-6nodes

jcaamano · 2025-10-10T12:11:45Z

/override ci/prow/lint

openshift-ci · 2025-10-10T12:12:02Z

@jcaamano: Overrode contexts on behalf of jcaamano: ci/prow/lint

In response to this:

/override ci/prow/lint

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the kubernetes-sigs/prow repository.

martinkennelly · 2025-10-10T12:21:14Z

/test qe-perfscale-payload-control-plane-6nodes

No need to retry if we dont think its a problem with this PR - its only going to waste time.

knobunc · 2025-10-10T14:07:24Z

/label staff-eng-approved

martinkennelly · 2025-10-10T14:18:15Z

/unhold

openshift-ci-robot · 2025-10-10T20:14:01Z

@martinkennelly: Jira Issue Verification Checks: Jira Issue OCPBUGS-62273
✔️ This pull request was pre-merge verified.
✔️ All associated pull requests have merged.
✔️ All associated, merged pull requests were pre-merge verified.

Jira Issue OCPBUGS-62273 has been moved to the MODIFIED state and will move to the VERIFIED state when the change is available in an accepted nightly payload. 🕓

In response to this:

/hold

Instructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the openshift-eng/jira-lifecycle-plugin repository.

martinkennelly added 3 commits September 29, 2025 12:15

openshift-ci bot added the do-not-merge/hold Indicates that a PR should not merge because someone has issued a /hold command. label Sep 29, 2025

openshift-ci bot requested review from kyrtapz and tssurya September 29, 2025 11:21

openshift-ci bot added the approved Indicates a PR has been approved by an approver from all required OWNERS files. label Sep 29, 2025

martinkennelly mentioned this pull request Oct 1, 2025

[release-4.20] OCPBUGS-62273: Networking: reset ovn-remote config and allow ovnkube controller to s… openshift/machine-config-operator#5317

Merged

martinkennelly mentioned this pull request Oct 2, 2025

[release-4.19] OCPBUGS-62670: Fix EgressIP stale GARP post reboot + pod restart #2774

Merged

openshift-ci bot assigned jechen0648, Meina-rh, mffiedler, qiowang721, rbbratta and weliang1 Oct 10, 2025

openshift-ci bot added the lgtm Indicates that a PR is ready to be merged. label Oct 10, 2025

openshift-ci-robot added the jira/valid-bug Indicates that a referenced Jira bug is valid for the branch this PR is targeting. label Oct 10, 2025

openshift-ci-robot removed the jira/invalid-bug Indicates that a referenced Jira bug is invalid for the branch this PR is targeting. label Oct 10, 2025

openshift-ci bot added the staff-eng-approved Indicates a release branch PR has been approved by a staff engineer (formerly group/pillar lead). label Oct 10, 2025

openshift-ci bot removed the do-not-merge/hold Indicates that a PR should not merge because someone has issued a /hold command. label Oct 10, 2025

openshift-merge-bot bot merged commit 84cdb99 into openshift:release-4.20 Oct 10, 2025
28 of 29 checks passed

[release-4.20] OCPBUGS-62273: Fix EgressIP stale GARP post reboot + pod restart #2767

[release-4.20] OCPBUGS-62273: Fix EgressIP stale GARP post reboot + pod restart #2767

Uh oh!

Conversation

martinkennelly commented Sep 29, 2025

Uh oh!

openshift-ci-robot commented Sep 29, 2025

Uh oh!

martinkennelly commented Oct 1, 2025

Uh oh!

martinkennelly commented Oct 1, 2025

Uh oh!

openshift-ci bot commented Oct 1, 2025

Uh oh!

openshift-ci bot commented Oct 1, 2025

Uh oh!

openshift-ci bot commented Oct 1, 2025

Uh oh!

martinkennelly commented Oct 2, 2025

Uh oh!

martinkennelly commented Oct 2, 2025

Uh oh!

openshift-ci bot commented Oct 2, 2025

Uh oh!

martinkennelly commented Oct 2, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

openshift-ci bot commented Oct 8, 2025

Uh oh!

openshift-ci bot commented Oct 8, 2025

Uh oh!

martinkennelly commented Oct 8, 2025

Uh oh!

martinkennelly commented Oct 8, 2025

Uh oh!

martinkennelly commented Oct 8, 2025

Uh oh!

martinkennelly commented Oct 8, 2025

Uh oh!

martinkennelly commented Oct 8, 2025

Uh oh!

openshift-ci bot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025

Uh oh!

openshift-ci-robot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025

Uh oh!

openshift-ci-robot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025

Uh oh!

openshift-ci-robot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

martinkennelly commented Oct 10, 2025

Uh oh!

jtaleric commented Oct 10, 2025

Uh oh!

openshift-ci bot commented Oct 10, 2025

Uh oh!

jtaleric commented Oct 10, 2025

Uh oh!

jcaamano commented Oct 10, 2025

Uh oh!

openshift-ci bot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

knobunc commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 10, 2025

Uh oh!

Uh oh!

openshift-ci-robot commented Oct 10, 2025

Uh oh!

martinkennelly commented Oct 2, 2025 •

edited

Loading

martinkennelly commented Oct 10, 2025 •

edited

Loading

martinkennelly commented Oct 10, 2025 •

edited

Loading