Loading...

XML

Word

Printable

Type: Bug
Resolution: Done-Errata
Priority: Undefined
Fix Version/s: 4.14.0
Affects Version/s: 4.13.z
Component/s: TALM Operator
Labels:

Activity Type:
Quality / Stability / Reliability
Blocked:
False
Blocked Reason:

Hide

None

Show
None
Story Points:
None
Severity:
Important
Regression:
No
Latest Status Summary:

Hide
8/15: fix merged, should be ON_QA & off this list soon
8/8: fix tested with upgrade-recovery qe pipeline (status: passed); awaiting lab from qe to re-run test again to proceed with merge.

Show
8/15: fix merged, should be ON_QA & off this list soon 8/8: fix tested with upgrade-recovery qe pipeline (status: passed); awaiting lab from qe to re-run test again to proceed with merge.

Target Backport Versions:
None
Target Version:

4.14.0
Release Blocker:
None
Sprint:
None

Internal Whiteboard:

SFDC Cases Counter:
SFDC Cases Open:
SFDC Cases Links:

Release Note Status:
None
Release Note Type:
None
Release Note Text:
None

Escape Reason:
None
Escape Impact:
None
Corrective Measures:
None
SDLC stage when should've been found:
None

Description of problem:

Upgrade recovery fails during the second phase due to a deprecated command in upgrade-recovery.sh. Summary of errors:

#/var/recovery/upgrade-recovery.sh --resume
...
Deprecated: Use `etcdutl snapshot status`

Version-Release number of selected component (if applicable):

Upgrade 4.13.z to 4.14

How reproducible:

Every Time

Steps to Reproduce:

1. Hub cluster running OCP 4.14, TALM 4.14, ZTP 4.14
2. Spoke Cluster running 4.13
3. Trigger platform-upgrade (ocp-far-edge-vran-upgrade-recovery pipeline can be used for this)
   3a. While upgrade is progressing, interrupt process by running /var/recovery/upgrade-recovery.sh
   3b. upgrade-recovery.sh first phase succeeds.
   3c. Manually reboot spoke cluster as per upgrade-recovery.sh output.
   3d. Run /var/recovery/upgrade-recovery.sh --resume
4. upgrade-recovery.sh fails with `Deprecated: Use `etcdutl snapshot status`

Actual results:

upgrade-recovery.sh fails when redeploying etcd.

Expected results:

upgrade-recovery.sh succeeds.

Additional info:

Summary of output from /var/recovery/upgrade-recovery.sh

"##### Tue Jul  4 22:10:27 UTC 2023: Completed restoring /var/lib/kubelet content",
        "##### Tue Jul  4 22:10:27 UTC 2023: Starting crio.service",
        "##### Tue Jul  4 22:10:27 UTC 2023: Restoring cluster",
        "etcdctl is already installed",
        "{\"hash\":4055618727,\"revision\":62187,\"totalKey\":13255,\"totalSize\":93892608}",
        "...stopping kube-apiserver-pod.yaml",
        "...stopping kube-controller-manager-pod.yaml",
        "...stopping kube-scheduler-pod.yaml",
        "...stopping etcd-pod.yaml",
        "Waiting for container etcd to stop",
        "complete",
        "Waiting for container etcdctl to stop",
        "complete",
        "Waiting for container etcd-metrics to stop",
        "complete",
        "Waiting for container kube-controller-manager to stop",
        "complete",
        "Waiting for container kube-apiserver to stop",
        "complete",
        "Waiting for container kube-scheduler to stop",
        "complete",
        "Moving etcd data-dir /var/lib/etcd/member to /var/lib/etcd-backup",
        "starting restore-etcd static pod",
        "starting kube-apiserver-pod.yaml",
        "static-pod-resources/kube-apiserver-pod-6/kube-apiserver-pod.yaml",
        "starting kube-controller-manager-pod.yaml",
        "static-pod-resources/kube-controller-manager-pod-10/kube-controller-manager-pod.yaml",
        "starting kube-scheduler-pod.yaml",
        "static-pod-resources/kube-scheduler-pod-7/kube-scheduler-pod.yaml",
        "##### Tue Jul  4 22:10:29 UTC 2023: Restarting kubelet.service",
        "##### Tue Jul  4 22:10:30 UTC 2023: Restarting crio.service",
        "##### Tue Jul  4 22:10:31 UTC 2023: Waiting for required container restarts",
        "##### Tue Jul  4 22:10:31 UTC 2023: Waiting for etcd container to restart",
        ".",
        "##### Tue Jul  4 22:10:42 UTC 2023: etcd container restarted",
        "##### Tue Jul  4 22:10:42 UTC 2023: Waiting for etcd-operator container to restart",
        "........",
        "##### Tue Jul  4 22:12:08 UTC 2023: etcd-operator container restarted",
        "##### Tue Jul  4 22:12:08 UTC 2023: Waiting for kube-apiserver-operator container to restart",
        "",
        "##### Tue Jul  4 22:12:10 UTC 2023: kube-apiserver-operator container restarted",
        "##### Tue Jul  4 22:12:10 UTC 2023: Waiting for kube-controller-manager-operator container to restart",
        "",
        "##### Tue Jul  4 22:12:11 UTC 2023: kube-controller-manager-operator container restarted",
        "##### Tue Jul  4 22:12:11 UTC 2023: Waiting for kube-scheduler-operator-container container to restart",
        "",
        "##### Tue Jul  4 22:12:11 UTC 2023: kube-scheduler-operator-container container restarted",
        "##### Tue Jul  4 22:12:11 UTC 2023: Required containers have restarted",
        "##### Tue Jul  4 22:12:11 UTC 2023: Triggering redeployments",
        "##### Tue Jul  4 22:12:11 UTC 2023: Triggering etcd redeployment"

 Deprecated: Use `etcdutl snapshot status`

blocks

OCPBUGS-18468 Upgrade Recovery Fails on etcd Redeployment

Closed

is cloned by

OCPBUGS-18468 Upgrade Recovery Fails on etcd Redeployment

Closed

links to

openshift-kni/cluster-group-upgrades-operator#620: wip: OCPBUGS-16032: Remove target directory in backup function of upgrade-recovery script

RHEA-2023:112754 OpenShift Container Platform 4.14.0 CNF vRAN extras update

mentioned on

Merge request - Updated US source to: 650f4ff Remove target directory in backup function of upgrade-recovery script (#620)

Assignee:: Sharat Akhoury

Reporter:: Joshua Clark

Need Info From:: None

Contributors:: None

QA Contact:: Joshua Clark

Doc Contact:: None

Votes:: 0 Vote for this issue

Watchers:: 7 Start watching this issue

Created:: 2023/07/11 1:35 PM

Updated:: 2025/07/26 5:35 AM

Resolved:: 2023/10/26 4:30 PM

Details

Description

Attachments

Issue Links

Easy Agile Planning Poker

Activity

People

Dates