Loading...

XML

Word

Printable

Type: Bug
Resolution: Done
Priority: Critical
Fix Version/s: None
Affects Version/s: 4.10
Component/s: kube-apiserver
Labels:
None

Work Type:
Quality / Stability / Reliability
Blocked:
False
Blocked Reason:

Hide

None

Show
None
Story Points:
None
Severity:
None
Regression:
None

Target Backport Versions:
None
Target Version:
None
Release Blocker:
Rejected
Sprint:
None

SFDC Cases Counter:
SFDC Cases Open:
SFDC Cases Links:

Release Note Status:
None
Release Note Type:
None
Release Note Text:
None

Escape Reason:
None
Escape Impact:
None
Corrective Measures:
None
SDLC stage when should've been found:
None

Description of problem:

clone of https://bugzilla.redhat.com/show_bug.cgi?id=2101290

Description of problem:
oc commands fails during node replacement procedure on 3 node master+slave cluster deployed via UPI. oc commands fails post drain and deleting powered down node from cluster
Exact steps followed:

One of node was brought down by powering off
$ oc get etcd -o=jsonpath='{range .items[0].status.conditions[?(@.type=="EtcdMembersAvailable")]}

{.message}

{"\n"}'
$ oc get nodes -o jsonpath='{range .items[]}

{"\n"}

{.metadata.name}

{"\t"}

{range .spec.taints[]}

{.key}

{" "}' | grep unreachable
$ oc rsh -n openshift-etcd etcd-layton.ocp2.sl.sdp.hop.lab.emc.com

etcdctl member list -w table
etcdctl member remove 252f3666c23ebe80
$ for i in oc get secrets -n openshift-etcd | grep ogden.ocp2.sl.sdp.hop.lab.emc.com;do oc delete secret $i -n openshift-etcd;done
$ oc get nodes --show-labels | grep ogden.ocp2.sl.sdp.hop.lab.emc.com
$ oc get pods -n openshift-storage -o wide | grep ogden.ocp2.sl.sdp.hop.lab.emc.com
$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-1 --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-2 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=ogden.ocp2.sl.sdp.hop.lab.emc.com --replicas=0 -n openshift-storage
$ oc adm drain ogden.ocp2.sl.sdp.hop.lab.emc.com --force --delete-local-data --ignore-daemonsets
$ oc delete node ogden.ocp2.sl.sdp.hop.lab.emc.com

After deleting node from above step, when we try to edit localvolume, oc command fails a mentioned below.

$ oc get nodes
Unable to connect to the server: EOF

Please note that we have deployed our product on openshift cluster which uses k8 resources prior to performing node replacement

Version-Release number of selected component (if applicable):
openshift 4.10.9

This is been created out of
https://access.redhat.com/support/cases/#/case/03228703
ticket.

Assignee:: Unassigned

Reporter:: Michal Fojtik (Inactive)

Need Info From:: None

Contributors:: None

QA Contact:: Ke Wang

Doc Contact:: None

Votes:: 0 Vote for this issue

Watchers:: 3 Start watching this issue

Created:: 2023/01/16 11:45 AM

Updated:: 2025/07/28 11:34 AM

Resolved:: 2023/05/18 7:39 PM

Details

Description

Attachments

Easy Agile Planning Poker

Activity

People

Dates

Hide