2017-05-02 24 views
0

현재 Hyper-V 환경에서 Debian 8.6의 VM 인스턴스를 실행 중입니다. VM은 탑재 된 한 대의 컴퓨터에서 NAS로 파일을 복사하는 여러 가지 cron 작업에 사용되며 복사 된 파일에 대해 일부 md5 체크섬도 실행합니다.Debian VM 주기적 충돌

내가 겪고있는 문제는 매 2 주마다 파일 시스템이 손상되어 내 cronjob이 실행을 멈추는 것입니다.

/tmp/crontab.Vvp59T: Input/output error 
Creation of temporary crontab file failed - aborting 

내가 또한 특정 명령을 인식하지 못하는주의 사항 : : 나는 crontab -e을 통해 crontab을 편집하려고하면, 나는 다음과 같은 오류 얻을 그때 파일 시스템 검사를 실행하려고

[email protected]:/home/ilienert# dmesg | lpr 
bash: lpr: command not found 

을하지만, 아무것도 작동하지 않았다. 여기에 내가 한 일지의 로그가 있습니다 :

[email protected]:/home/ilienert# parted /dev/sda 'print' 
Model: Msft Virtual Disk (scsi) 
Disk /dev/sda: 53.7GB 
Sector size (logical/physical): 512B/4096B 
Partition Table: gpt 
Disk Flags: 
Number Start End  Size File system  Name Flags 
1  1049kB 538MB 537MB fat32     boot, esp 
2  538MB 51.5GB 51.0GB ext4 
3  51.5GB 53.7GB 2145MB linux-swap(v1) 
[email protected]:/home/ilienert# fsck /dev/sda2 
fsck from util-linux 2.25.2 
e2fsck 1.42.12 (29-Aug-2014) 
/dev/sda2: recovering journal 
fsck.ext4: Bad magic number in super-block while trying to re-open /dev/sda2 
/dev/sda2: ********** WARNING: Filesystem still has errors ********** 
[email protected]:/home/ilienert# echo $? # status of last command 
12 

마지막으로 VM을 재부팅 할 때 this splash이 표시됩니다. 그리고이 시점에서 우리는 이전 상태에서 VM을 복원해야합니다. VM은 다시 실패하기 전에 몇 주 동안 정상적으로 작동합니다. 왜 이런 일이 계속 일어나는 지 아십니까?

Debian version: 8.6.0
Hyper-V is running on two clustered servers with Windows Server 2016 Datacenter
Hardware specs Hyper-V hosts: 2x E5-2650v2 8-Cores, 256GB DDR3 RAM
Backup solution: Veeam Backup & Replication 9.5
VM specs:
Clustered: yes
Generation: 2
Dynamic memory: 16834MB
Number of virtual processors: 4
Hard disk type: VHDX

편집 : 여기

는 우리의 환경의 사양입니다 dmesg output

답변

0

에게 그것을 : 여기가 바로 실패 후 dmesg을 실행할 수 있었다 때 이전 시간까지 파고 스크린 샷입니다 당신이 게시 한 정보에서 무엇이 잘못되고 있는지 (시간이 흐르면서) 깨닫기가 어렵습니다. 좀 더 조사해야 할까봐 걱정됩니다. 다음과 같은 두 가지 사항을 염두에 두십시오.

1) 가상 컴퓨터가 호스팅되는 실제 하드 드라이브가 작동하지 않을 가능성을 무시할 수 없습니다. 가능한 경우 가상 컴퓨터를 통하지 않고 자체적으로 디스크를 확인하는 것이 좋습니다.

2) 시스템을 복원 한 후에는 기본 시스템 로그에 매일 눈을 떼지 마십시오. 시스템에 어떤 문제가 있는지 설명하는 데 도움이되는 (오류) 메시지가있을 수 있습니다. 보통은 기본 로그를 확인하고 파일에 결과를 추가하기 위해 bash 명령을 일부 실행합니다 (시스템에 이러한 모든 로그가 없을 수도 있고, 설치되지 않은 패키지가 필요할 수도 있고, 적응하기가 자유로울 수도 있습니다). 자신의 용도) :

echo '---------Dmesg-----------' >> /var/log/mylog.txt 
dmesg --level=emerg,alert,crit,err >> /var/log/mylog.txt 2>&1 
echo '---------systemctl-----------' >> /var/log/mylog.txt 
systemctl --state=failed --all -q >> /var/log/mylog.txt 2>&1 
echo '---------grep Xorg.0.log-----------' >> /var/log/mylog.txt 
grep -wi 'error\|fail\|fault\|corruption\|hung\|lockup\|unkown\|segmentation\|critical\|missing\|(EE)' /var/log/Xorg.0.log >> /var/log/mylog.txt 2>&1 
echo '---------journalctl - the last report-----------' >> /var/log/mylog.txt 
journalctl -q --boot -0 --priority=3 >> /var/log/mylog.txt 2>&1 
echo '---------grep var/log/boot.log -----------------' >> /var/log/mylog.txt 
grep -wi 'error\|fail\|fault\|corruption\|hung\|lockup\|unkown\|segmentation\|critical\|missing' /var/log/boot.log >> /var/log/mylog.txt 2>&1 
echo '---------end of mylog reports-----------' >> /var/log/mylog.txt 

문제가 발생할 때까지 매일 컴퓨터를 재부팅하는 것이 좋습니다.

도움이 되었기를 바랍니다.

+0

고마워요. 좀 더 관련성이 높은 정보가 들어있는 제 편집을 참조하십시오. – BGSGunterGlut

+0

다음과 같은 몇 가지 추가 제안 사항을 권장합니다. 컴퓨터를 복원하고 복원 직후 'fsck'를 실행하십시오. 문제가 해결되면 fsck man을 참조하십시오. 복원 할 시스템의 새 상태를 명시하고 시스템을 다시 사용하여 최상의 상태를 유지하십시오. 다시 말하지만,이 하드 드라이브 상태에 대해 의심을 품고 문제가 지속되면 구조 시스템 부팅에서 광범위한 테스트를 실행합니다. 이 모든 것이 실패하면 매일 로그를 확인하고 거기에서 발견 한 오류로 오류를 조사하십시오. 행운을 빕니다! –