Loading...

XML

Word

Printable

Type: Bug
Resolution: Obsolete
Priority: Normal
Fix Version/s: None
Affects Version/s: ACM 2.11.0
Component/s: Observability
Labels:
- obs-triaged
- triaged

Story Points:
1
Blocked:
False
Blocked Reason:

Hide

None

Show
None
Ready:
False
Intelligence Requested:
Market:

Severity:
Moderate

Regression:
None

SFDC Cases Links:
SFDC Cases Open:
SFDC Cases Counter:

PX Impact Score:

Description of problem:

We observed 3 0f 3628 managed SNOs shows observabilityaddon degraded as shown below.

# oc get observabilityaddon -A -ojson | jq -r '.items[] | "(.status.conditions[] | select(.type=="Degraded" and .status=="True").lastTransitionTime) (.metadata.namespace)"'

{{ 2024-07-11T20:02:51Z vm01681 }}

{{2024-07-11T19:34:23Z vm03095 }}

{{2024-07-11T16:47:40Z vm03544 }}

#

These three clusters are not shown in graphana UI. in the metrics-collector pod log,metrics-collector-deployment_pod.log, we see:

level=error caller=logger.go:60 ts=2024-07-11T19:34:23.212608332Z component=collectrule/evaluator msg="failed to evaluate collect rule" err="Get \"https://prometheus-k8s.openshift-monitoring.svc:9091/api/v1/query?query=%281+-avg%28rate%28node_cpu_seconds_total%7Bmode%3D%22idle%22%7D%5B5m%5D%29%29%29%2A+100+%3E+70\": tls: failed to verify certificate: x509: certificate signed by unknown authority" rule="(1 - avg(rate(node_cpu_seconds_total{mode=\"idle\"}[5m]))) * 100 > 70"

Talked to rh-ee-coquadro , was suggested to delete the observability-controller-open-cluster-management.io-observability-signer-client-cert. then the pod was recreated and the cluster was connected to obs server.

Version-Release number of selected component (if applicable):

How reproducible:

Steps to Reproduce:

Actual results:

Expected results:

Additional info:

- - Sort By Name
  - Sort By Date
  - Ascending
  - Descending
  - Thumbnails
  - List
  - Download All

hub-acm-must-gather.tar.gz
105.41 MB
2024/07/26 1:07 AM
hub-acm-must-gather-2.tar.gz
121.61 MB
2024/07/26 1:07 AM
metrics-collector-deployment_pod.log
24.01 MB
2024/07/12 2:32 PM
vm00024-obs-acm-must-gather.tar.gz
3.20 MB
2024/07/17 7:16 PM
vm00024-obs-ocp-must-gather.tar.gz
31.64 MB
2024/07/17 7:16 PM
vm00767-obsaddon-degraded-must-gather.tar.gz
19.28 MB
2024/07/25 7:24 PM
vm01296-obsaddon-degraded-must-gather.tar.gz
19.01 MB
2024/07/25 7:37 PM

Assignee:: Coleen Iona Quadros

Reporter:: Ting Xue

QA Contact:: Xiang Yin

Team:: ACM QE Team

Votes:: 0 Vote for this issue

Watchers:: 4 Start watching this issue

Created:: 2024/07/12 2:30 PM

Updated:: 2025/08/26 1:22 PM

Resolved:: 2025/08/26 1:22 PM

Details

Description

Description of problem:

Version-Release number of selected component (if applicable):

How reproducible:

Steps to Reproduce:

Actual results:

Expected results:

Additional info:

Attachments

Attachments

Easy Agile Planning Poker

Activity

People

Dates