2017-11-14 18 views
0

나는 하나의 마스터와 2 개의 에이전트가있는 간단한 mesos 클러스터를 가지고 있습니다. 모두 VPS이며 가상 LAN을 통해 연결됩니다. 마스터 및 에이전트 서비스를 시작하면 mesos UI를 통해 마스터에서 활성화 된 두 에이전트를 볼 수있었습니다. 마라톤 UI를 통해 간단한 응용 프로그램 (cmd : "echo hello; sleep 5")을 배포하면 mesos UI는 에이전트 1에서 프로그램이 실행되고 완료되었음을 보여 주지만 에이전트 2에서는 응용 프로그램 상태가 항상 준비되어 있습니다.복수 노드 등록 실패 (mesos)

로그에서 에이전트 2의 경우 에이전트 2가 등록되지 않는 반면 에이전트 1은 등록되지 않습니다. 아래는 상담원 2 로그입니다.

I1114 07:54:05.399139 8985 slave.cpp:251] Flags at startup: --appc_simple_discovery_uri_prefix="http://" --appc_store_dir="/tmp/mesos/store/appc" --authenticate_http_executors="false" --authenticate_http_readonly="false" --authenticate_http_readwrite="false" --authenticatee="crammd5" --authentication_backoff_factor="1secs" --authorizer="local" --cgroups_cpu_enable_pids_and_tids_count="false" --cgroups_enable_cfs="false" --cgroups_hierarchy="/sys/fs/cgroup" --cgroups_limit_swap="false" --cgroups_root="mesos" --container_disk_watch_interval="15secs" --containerizers="mesos" --default_role="*" --disallow_sharing_agent_pid_namespace="false" --disk_watch_interval="1mins" --docker="docker" --docker_kill_orphans="true" --docker_registry="https://registry-1.docker.io" --docker_remove_delay="6hrs" --docker_socket="/var/run/docker.sock" --docker_stop_timeout="0ns" --docker_store_dir="/tmp/mesos/store/docker" --docker_volume_checkpoint_dir="/var/run/mesos/isolators/docker/volume" --enforce_container_disk_quota="false" --executor_registration_timeout="1mins" --executor_reregistration_timeout="2secs" --executor_shutdown_grace_period="5secs" --fetcher_cache_dir="/tmp/mesos/fetch" --fetcher_cache_size="2GB" --frameworks_home="" --gc_delay="1weeks" --gc_disk_headroom="0.1" --hadoop_home="" --help="false" --hostname_lookup="true" --http_command_executor="false" --http_heartbeat_interval="30secs" --initialize_driver_logging="true" --ip="10.0.0.5" --isolation="posix/cpu,posix/mem" --launcher="linux" --launcher_dir="/usr/libexec/mesos" --logbufsecs="0" --logging_level="INFO" --master="10.0.0.6:5050" --max_completed_executors_per_framework="150" --oversubscribed_resources_interval="15secs" --perf_duration="10secs" --perf_interval="1mins" --port="5051" --qos_correction_interval_min="0ns" --quiet="false" --recover="reconnect" --recovery_timeout="15mins" --registration_backoff_factor="1secs" --revocable_cpu_low_priority="true" --runtime_dir="/var/run/mesos" --sandbox_directory="/mnt/mesos/sandbox" --strict="true" --switch_user="true" --systemd_enable_support="true" --systemd_runtime_directory="/run/systemd/system" --version="false" --work_dir="/var/lib/mesos/agent" 
I1114 07:54:05.401047 8985 slave.cpp:565] Agent resources: [{"name":"cpus","scalar":{"value":4.0},"type":"SCALAR"},{"name":"mem","scalar":{"value":6959.0},"type":"SCALAR"},{"name":"disk","scalar":{"value":43131.0},"type":"SCALAR"},{"name":"ports","ranges":{"range":[{"begin":31000,"end":32000}]},"type":"RANGES"}] 
I1114 07:54:05.404896 8985 slave.cpp:573] Agent attributes: [ ] 
I1114 07:54:05.404913 8985 slave.cpp:582] Agent hostname: 10.0.0.5 
I1114 07:54:05.405012 8982 status_update_manager.cpp:177] Pausing sending status updates 
I1114 07:54:05.405889 8983 state.cpp:64] Recovering state from '/var/lib/mesos/agent/meta' 
I1114 07:54:05.405936 8983 state.cpp:722] No committed checkpointed resources found at '/var/lib/mesos/agent/meta/resources/resources.info' 
I1114 07:54:05.406015 8983 state.cpp:108] Failed to find the latest agent from '/var/lib/mesos/agent/meta' 
I1114 07:54:05.411798 8987 status_update_manager.cpp:203] Recovering status update manager 
I1114 07:54:05.411916 8988 containerizer.cpp:609] Recovering containerizer 
I1114 07:54:05.413099 8985 provisioner.cpp:416] Provisioner recovery complete 
I1114 07:54:05.413230 8984 slave.cpp:6295] Finished recovery 
I1114 07:54:05.413630 8984 status_update_manager.cpp:177] Pausing sending status updates 
I1114 07:54:05.413666 8981 slave.cpp:971] New master detected at [email protected]:5050 
I1114 07:54:05.413694 8981 slave.cpp:995] No credentials provided. Attempting to register without authentication 
I1114 07:54:05.413712 8981 slave.cpp:1006] Detecting new master 

에이전트 # 1 로그 상기와 동일하지만, 결국은

I1114 07:57:17.609352 1645 slave.cpp:1006] Detecting new master 
I1114 07:57:18.426383 1642 slave.cpp:1286] Re-registered with master [email protected]:5050 
I1114 07:57:18.426463 1645 status_update_manager.cpp:184] Resuming sending status updates 
I1114 07:57:18.426465 1642 slave.cpp:1323] Forwarding total oversubscribed resources {} 

내가 뭔가 잘못을 구성하고 이러한 추가 라인이있다? 아니면이 mesos 버그가 무엇입니까? (아마 나는 추측한다).

답변

0

방화벽 에이전트 2. 포트 5050 및 5051을 열어했다 활성화 된 지금은 잘 UFW는 5050 UFW는 5051

수 있도록 작동