Loading...

XML

Word

Printable

Type: Bug
Resolution: Done
Priority: Critical
Fix Version/s: 4.18.z
Affects Version/s: 4.18.z
Component/s: Node / Kubelet
Labels:
- Regression
- triaged

Activity Type:
Quality / Stability / Reliability
Blocked:
False
Blocked Reason:

Hide

None

Show
None
Story Points:
None
Severity:
None
Regression:
None

Target Backport Versions:
None
Target Version:
None
Release Blocker:
None
Sprint:
OCP Node Sprint 268 (Green)
sprint_count:
1

RH Private Keywords:

SFDC Cases Counter:
SFDC Cases Open:
SFDC Cases Links:

PX Review Complete:
PX Impact Score:

Release Note Status:
None
Release Note Type:
None
Release Note Text:
None

Escape Reason:
None
Escape Impact:
None
Corrective Measures:
None
SDLC stage when should've been found:
None

Description of problem:

    Guaranteed pods fails to start on worker nodes where Performance profile is applied

Version-Release number of selected component (if applicable):

    4.18.2

How reproducible:

    Everytime

Steps to Reproduce:

    1. Apply the below performance profile
apiVersion: performance.openshift.io/v2
kind: PerformanceProfile
metadata:
  name: performance
spec:
  cpu:
    isolated: 1-39,41-79
    reserved: 0,40
  machineConfigPoolSelector:
    pools.operator.machineconfiguration.openshift.io/worker: ""
  nodeSelector:
    node-role.kubernetes.io/worker: ""
  numa:
    topologyPolicy: single-numa-node

2. Make the node cgroupv1

apiVersion: config.openshift.io/v1
kind: Node
metadata:
  name: cluster
spec:
  cgroupMode: "v1"

3. Create a guaranteed pod as show below:

apiVersion: v1
kind: Pod
metadata:
  name: pod1
 # annotations:
 #   cpu-load-balancing.crio.io: "disable"
spec:
  containers:
  - name: test-container1
    image: registry.hlxcl12.lab.eng.tlv2.redhat.com:5000/cnf-tests:4.14
    command:
    - sleep
    - inf
    resources:
      limits:
        memory: "100Mi"
        cpu: "2"
  nodeSelector:
    kubernetes.io/hostname: worker-0

Actual results:

[root@registry ~]# oc get pods
NAME   READY   STATUS                 RESTARTS   AGE
pod1   0/1     CreateContainerError   0          24s

Events:
  Type     Reason          Age               From               Message
  ----     ------          ----              ----               -------
  Normal   Scheduled       47s               default-scheduler  Successfully assigned default/pod1 to worker-0
  Normal   AddedInterface  48s               multus             Add eth0 [10.131.0.21/23] from ovn-kubernetes
  Normal   Pulling         48s               kubelet            Pulling image "registry.hlxcl12.lab.eng.tlv2.redhat.com:5000/cnf-tests:4.14"
  Normal   Pulled          26s               kubelet            Successfully pulled image "registry.hlxcl12.lab.eng.tlv2.redhat.com:5000/cnf-tests:4.14" in 21.544s (21.544s including waiting). Image size: 1244232582 bytes.
  Warning  Failed          2s (x4 over 26s)  kubelet            Error: container create failed: write file `cpuset.cpus`: Device or resource busy
  Normal   Pulled          2s (x3 over 26s)  kubelet            Container image "registry.hlxcl12.lab.eng.tlv2.redhat.com:5000/cnf-tests:4.14" already present on machine

Expected results:

pod should run successfully

Additional info:

Assignee:: Peter Hunt

Reporter:: Niranjan Mallapadi Raghavendra Rao

Contributors:: Talor Itzhak

QA Contact:: Aditi Sahay

Need Info From:: None

Votes:: 0 Vote for this issue

Watchers:: 20 Start watching this issue

Created:: 2025/03/05 12:48 PM

Updated:: 2026/02/26 5:12 PM

Resolved:: 2026/02/26 5:12 PM

Details

Description

Attachments

Easy Agile Planning Poker

Activity

People

Dates