Loading...

This issue belongs to an archived project. You can view it, but you can't modify it. Learn more

XML

Word

Printable

Type: Bug
Resolution: Done
Priority: Major
Fix Version/s: 9.4.0.Final
Affects Version/s: 9.3.3.Final
Component/s: State Transfer
Labels:
None

Sprint:
Sprint 9.4.0.Final
Git Pull Request:
https://github.com/infinispan/infinispan/pull/6281

Here's the scenario:
1. Cluster contains caches on 2 members, node-1 and node-2
2. node-2 is killed
3. node-2 is restarted (using same physical address)
4. State transfer initiates, view contains node-1, suspected node-2, and reincarnated node-2
5. State transfer times out

Log of node-1 includes:

12:09:51,882 WARN  [org.infinispan.topology.ClusterTopologyManagerImpl] (transport-thread--p14-t4) ISPN000197: Error updating cluster member list: org.infinispan.util.concurrent.TimeoutException: ISPN000476: Timed out waiting for responses for request 3 from node-2
	at org.infinispan.remoting.transport.impl.MultiTargetRequest.onTimeout(MultiTargetRequest.java:167)
	at org.infinispan.remoting.transport.AbstractRequest.call(AbstractRequest.java:87)
	at org.infinispan.remoting.transport.AbstractRequest.call(AbstractRequest.java:22)
	at java.util.concurrent.FutureTask.run(FutureTask.java:266) [rt.jar:1.8.0_181]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180) [rt.jar:1.8.0_181]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) [rt.jar:1.8.0_181]
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) [rt.jar:1.8.0_181]
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) [rt.jar:1.8.0_181]
	at java.lang.Thread.run(Thread.java:748) [rt.jar:1.8.0_181]
	Suppressed: org.infinispan.util.logging.TraceException
		at org.infinispan.remoting.transport.Transport.invokeRemotely(Transport.java:75)
		at org.infinispan.topology.ClusterTopologyManagerImpl.confirmMembersAvailable(ClusterTopologyManagerImpl.java:525)
		at org.infinispan.topology.ClusterTopologyManagerImpl.updateCacheMembers(ClusterTopologyManagerImpl.java:508)
		at org.infinispan.topology.ClusterTopologyManagerImpl.handleClusterView(ClusterTopologyManagerImpl.java:321)
		at org.infinispan.topology.ClusterTopologyManagerImpl.access$500(ClusterTopologyManagerImpl.java:87)
		at org.infinispan.topology.ClusterTopologyManagerImpl$ClusterViewListener.lambda$handleViewChange$0(ClusterTopologyManagerImpl.java:731)
		at org.infinispan.executors.LimitedExecutor.runTasks(LimitedExecutor.java:175)
		at org.infinispan.executors.LimitedExecutor.access$100(LimitedExecutor.java:37)
		at org.infinispan.executors.LimitedExecutor$Runner.run(LimitedExecutor.java:227)
		at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) [rt.jar:1.8.0_181]
		at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) [rt.jar:1.8.0_181]
		at org.wildfly.clustering.service.concurrent.ClassLoaderThreadFactory.lambda$newThread$0(ClassLoaderThreadFactory.java:47)
		... 1 more

I've attached trace logs from node-1 and node-2.

Changing ClusterTopologyManagerImpl.confirmMembersAvailable() to use ResponseMode.SYNCHRONOUS_IGNORE_LEAVERS instead of ResponseMode.SYNCHRONOUS allows state transfer to complete successfully.

- - Sort By Name
  - Sort By Date
  - Ascending
  - Descending
  - Thumbnails
  - List
  - Download All

log.rtf
133 kB
2018/11/01 1:26 PM
node-1.zip
8.73 MB
2018/09/14 2:05 PM
node-2.zip
7.44 MB
2018/09/14 2:05 PM
Test.java
12 kB
2018/09/18 11:51 AM

causes

WFLY-10736 Server in cluster hangs during start after previous kill

Closed

is caused by

JGRP-2294 ForkProtocolStack ignores UnknownForkHandler for message batches

Resolved

Assignee:: Dan Berindei (Inactive)

Reporter:: Paul Ferraro

Archiver:: Amol Dongare

Created:: 2018/09/14 2:04 PM

Updated:: 2021/10/24 6:53 AM

Resolved:: 2018/09/27 9:13 AM

Archived:: 2024/11/28 6:21 AM

Details

Description

Attachments

Attachments

Issue Links

Easy Agile Planning Poker

Activity

People

Dates

PagerDuty