Добрый день!
тестирую два сервера в отказоустойчивом кластере на glusterfs, отправляю в перезагрузку один, создаю файл на втором.
После входа в строй обнаруживаю split-brain. новая синхронизация длится 2 часа - почти терабайт данных.
Подскажите что делать с этой бедой, ==> /var/log/glusterfs/storage-glusterfs-.log <==
[2013-11-30 11:51:07.57416] I [afr-self-heal-common.c:705:afr_mark_sources] 0-replicate: split-brain possible, no source detected
[2013-11-30 11:51:07.57518] W [fuse-bridge.c:419:fuse_attr_cbk] 0-glusterfs-fuse: 10: LOOKUP() / => -1 (Input/output error)
[2013-11-30 11:51:07.62235] I [afr-self-heal-common.c:705:afr_mark_sources] 0-replicate: split-brain possible, no source detected
[2013-11-30 11:51:07.515278] I [afr-self-heal-common.c:705:afr_mark_sources] 0-replicate: split-brain possible, no source detected
Конфиг glusterfsd:
volume SRV01-GLASTER
type protocol/client
option transport-type tcp
option remote-host 10.1.1.1
option remote-subvolume brick
end-volume
volume SRV02-GLASTER
type protocol/client
option transport-type tcp
option remote-host 10.1.1.2
option remote-subvolume brick
end-volume
volume replicate
type cluster/replicate
subvolumes SRV01-GLASTER SRV02-GLASTER
end-volume
volume writebehind
type performance/write-behind
option cache-size 1MB
subvolumes replicate
end-volume
volume cache
type performance/io-cache
option cache-size 512MB
subvolumes writebehind
end-volume
Конфиг клиентов:
volume SRV01-GLASTER
type protocol/client
option transport-type tcp
option remote-host 10.1.1.1
option remote-subvolume brick
end-volume
volume SRV02-GLASTER
type protocol/client
option transport-type tcp
option remote-host 10.1.1.2
option remote-subvolume brick
end-volume
volume replicate
type cluster/replicate
subvolumes SRV01-GLASTER SRV02-GLASTER
end-volume
volume writebehind
type performance/write-behind
option cache-size 1MB
subvolumes replicate
end-volume
volume cache
type performance/io-cache
option cache-size 512MB
subvolumes writebehind
end-volume