Linux服務器的故障排除方法

發布時間:2019-11-07 13:03 來源:互聯網 當前欄目:電腦基礎知識

  由于Linux操作系統易于使用,因此大多數用戶選擇Linux操作系統,但是如果Linux系統出現故障,我們需要使用一些補救措施進行故障排除。讓我們看一下Linux服務器的典型的故障排除方法。
  一、linux系統故障診斷:
  我們將按照系統啟動順序為大家介紹LINUX下的故障排除方法。
  1、linux系統啟動故障:這是在Linux操作系統中經常會遇到的問題。系統不能啟動的原因主要有——在安裝Linux操作系統的過程中,LILO配置信息錯誤,導致安裝完畢后,系統不能正常啟動;重新安裝其他的操作系統,也經常會導致原來的Linux不能啟動。因為這些新安裝的操作系統默認在計算機中沒有其他的操作系統,因而改寫了硬盤的主引導記錄(MBR),覆蓋了Linux操作系統中的LILO系統引導程序,致使最后無法啟動LILO。在操作Linux操作系統過程中,由于運行了錯誤的Linux命令,使系統重新啟動時出現異常。
  如果在Linux操作系統安裝過程中或安裝過程后,制作了Linux系統的急救啟動盤組,使用這些急救盤啟動系統即可進入系統,然后對相應錯誤進行配置即可解決問題:如果沒有制作急救啟動盤組,Linux系統不能啟動,該怎么辦呢?下面介紹三種解決方法。
 。1)進入Linux操作系統單用戶模式,在boot提示符后,輸入linux single,在此模式下啟動Linux,LILO配置和網絡配置信息不加載在啟動過程中。
 。2)光盤啟動,用第一張安裝Linux操作系統的光盤(啟動光盤)啟動硬盤的Linux系統,主板BIOS里要設置成光盤啟動,重啟機器后,出現boot:提示符后鍵入:
  vmlinuz toot=/dev/linuxrootpartition
  其中,root=后面填入Linux root分區的分區號,也就是Linux系統的root文件系統所在的硬盤分區位置,例如:vmlinuz root=/dev/hda3 noinitrd。按回車鍵之后,即可進入Linux系統。如果想恢復被破壞的LILO 系統引導程序,可以在編輯/etc/lilo.config之后,運行/sbin/lilo即可。這種方法也適合其他原因對Linux操作系統造成的破壞。
  小提示:上面介紹了通過光盤啟動的方法,當然軟盤啟動操作系統的過程與步驟是一樣的。
 。3)在DOS下運行loadlin程序啟動系統。在個人計算機使用Linux系統時,通常都是Linux和Windows 9x或Windows 2000并存的。如果知道Linux系統在硬盤上的確切安裝分區,并且有loadlin程序(在Red Hat Linux光盤的dosutil目錄下就有這個程序),也可以啟動Linux系統。Loadlin是DOS系統下的程序,運行它可以從DOS系統下直接啟動Linux系統,快速進入Linux環境。除loadlin程序之外,還需要一個Linux啟動內核的映象文件vmlinuz,在Red Hat linux光盤的images目錄下有這個文件。例如,如果在Windows 2000系統下面,進入DOS的命令模式,然后運行下述的loadlin命令,即可重新進入Linux系統:
  loadlin vmlinuz root=/dev/linuxrootpartition
  命令執行后,就開始引導Linux系統。用root身份登錄后,編輯/etc/lilo.config之后,運行/sbin/lilo即可,這樣操作后則重新將LILO系統引導程序裝入MBR。
  上面介紹的三種方法比較起來還是第一種LILO配置法比較簡單實用,第二種需要光盤的支持,而第三種操作起來相對繁瑣。
  2、linux文件系統故障: 在Linux操作系統中,這也是一種經常會遇到的故障。由于系統不正常關機,或突然掉電等原因引起文件系統被破壞。當文件系統被破壞時,可以使用相應的fsck命令進行文件系統的修復。例如下面的命令:fsck? /dev/hda5。
  小提示:關于fsck命令具有參數的使用方法,可以參閱linux的參考手冊。如果使用的是ext2fs類型的文件系統,就可從軟盤運行e2fsck命令來修正文件系統中被損壞的數據。
  但是有一點要注意:如果文件系統被破壞的原因是超級塊被損壞,超級塊是文件系統的“頭部”,它包含文件系統的狀態、尺寸和空閑磁盤塊等信息。如果損壞樂意個文件系統的超級快(例如不小心直接將數據寫到了文件系統的超級快分區中),那么Linux可能會完全不識別該文件系統,即使采用fsck或e2fsck命令也不能修復它了。這時候,只有到安裝光盤中看看有沒有對應的文件系統,將此文件覆蓋原操作系統被破壞的文件來恢復了。如果不小心刪除了系統中重要的文件,也可采用這種方法來試試。
  3、linux函數庫故障:? 在Linux操作系統中,如果不慎將系統中的函數庫文件破壞,或者破壞了/lib目錄下符號鏈接,那么將導致依賴這些庫的命令無法執行。這也是比較常見的系統故障。
  最簡單的解決辦法是用急救啟動盤組啟動系統,在/mnt目錄上安裝硬盤文件系統,然后修復/mnt/lib目錄下的庫。
  4、linux登錄系統故障: 由于管理員忘記密碼,或者由于系統受到黑客的入侵導致系統密碼文件被修改。導致管理員可能無法用帳號登錄系統。
  具體解決方法如下:
 。1)在系統啟動時,進入單用戶模式(Linux Single),然后用passwd命令重新設置密碼,或修改密碼文件借口恢復正常。
 。2)用急救啟動盤組啟動系統,然后將硬盤的文件系統安裝到/mnt目錄下,編輯/mnt/etc/passwd文件進行恢復。
 。3)將安裝系統的硬盤拆下來,放在另一個Linux系統中,然后掛載此硬盤的系統安裝區,將次硬盤分區中的/etc/passwd、/etc/shadow、/etc/group文件覆蓋或修改,也可以恢復。
  5、linux系統的KDE環境故障:如果Linux系統的KDE環境無法正常啟動,例如以普通帳號運行startx命令后,出現:“……can not start X server. Perhaps you do not have console ownership?”類似的提示。出現這種提示的原因是可能別的用戶曾經運行KDE環境,并在系統中留下標示此用戶的緩存文件。
  運行如下命令:
  rm? -rf/tmp/*
  然后,重新運行startx命令即可進入KDE環境。
  如果以普通帳號運行startx命令后,出現“can not start X server”的錯誤提示,并且不斷地有報錯提示的英文字符傷上翻滾,導致無法進入KDE環境。出現這種情況,可能是由于對Linux系統的不正常關機,導致了不能進入Linux的KDE 環境。
  在控制臺下以root身份登錄,鍵入setup命令,出現系統設置菜單,選擇其中的“X窗口設置”,然后依照提示正確設置顯示器的類型、刷新頻率、顯存大小和分辨率等。這樣將系統中的X 窗口重新設置一遍。
  如果沒有報錯,系統會自動啟動KDE環境,需要注意的一點是:在用setup命令進行設置時,可能還會有大量的英文字符在屏幕上翻滾,這是不要緊,請繼續看清屏幕,使用Tab鍵或方向鍵進行上面的配置,配置無誤后,會立刻恢復KDE環境的。
  二、網絡故障診斷
  既然是服務器,那么linux系統已經要連接到網絡才能發揮他的效果和能量。所以說在實際工作中linux系統的網絡故障也是急需排除的。
  1、無法ping通LINUX服務器: 當在Linux系統中IP地址無法Ping通時,主要原因是由于網絡信息配置的錯誤導致的。
  具體解決方法介紹如下:
 。1)使用ifconfig命令重新配置網卡地址,命令行如下:
  $ifconfig eht0192.168.1.2 netmask 255.255.255.0
  $ifdown eth0
  $ifup eth0
  然后用Ping命令,就可以Ping通IP地址192.168.1.2了。
 。2)修改系統中的網絡配置文件也可以到到上面的目的,建議使用這種方法,這樣的操作更加可靠。
  進入網絡配置文件所在的目錄:
  $cd/etc/sysconfig/network-scripts
  $1s
  ifcfg-eth0 ifdown-ipv6? ifdown-sit? ifup-aliases? ifup-plip? ifup-ppp? ifup-sl
  ifcfg-1o?? ifdown-post?? ifdown-sl?? ifup-ipv6?? ifup-plusb?? ifup-routes? network-functions
  ifdown?? ifdown-ppp? ifup?? ifup-ipx?? ifup-post?? ifup-sit?? network-functions-ipv6
  用vi命令修改ifcfg-eth0文件中下面的一行即可,例如:
  IPADDR=192.168.1.2
  其中192.168.1.2是所要修改或重新配置的地址,配置完畢后,重新啟動機器就可以使IP地址的改動生效。
  2、本機無法訪問外部網絡:如果在Linux操作系統中無法訪問外部,例如Ping公網的IP地址不通,而Ping自己機器的地址可以通,一般原因是網關信息沒有配置正確。
  解決方法如下:
  采用上面的第二種方法(直接修改網關配置文件)可以快速解決問題,操作步驟如下,進入網關配置文件所在目錄:
  $cd/etc/sysconfig
  $1s
  apmd?? authconfig?? clock.OLD?? gpm?? i18n?? keyboard?? network?? provider
  sendmail?? apm-scripts?? cdq?? console?? harddisks?? identd?? kudzu
  用vi命令修改此目錄下network文件中下面的一行即可,例如:
  GATEWAY=192.168.1.1
  其中192.168.1.1是所要修改或重新配置的網關地址,配置完畢后,重新啟動機器就可以使網關地址的改動生效。
  3、DNS域名解析故障:如果在Linux系統中無法進行域名解析,最可能的原因是沒有在本地指定有效的域名服務器,這種情況比較常見。
  解決辦法如下:
  一般修改和域名服務相關的文件如/etc/hosts或/etc/resolv.conf,在這些文件中添加有效的域名服務器的IP地址就可以解決。如果判斷不是本地域名解析的問題,例如在本地可以解析公司域名,但外面的客戶無法正常解析公司域名,則需要和域名注冊服務提供商聯系,一起解決問題。因為此種情況的發生,可能是公司系統中的IP地址和注冊的域名不對應的原因造成的。
  以上就是最常見Linux服務器的典型故障的排除方法,不過大家遇到的問題肯定不止于此,首先希望這些能幫助到大家,另外如果有什么問題或者解決問題的方法可以分享給小編哦~
  • 1、
  • 2、
  • 3、
  • 4、
  • 5、
  • 6、
  • 7、
  • 8、
  • 9、
  • 10、
  • 11、
  • 12、
  • 13、
  • 14、
  • 15、
  • 16、
  • 17、
  • 18、
  • 19、
  • 20、
  • 21、
  • 22、
  • 23、
  • 24、
  • 25、
  • 1、
  • 2、
  • 3、
  • 4、
  • 5、
  • 6、
  • 7、
  • 8、
  • 9、
  • 10、
  • 11、
  • 12、
  • 13、
  • 14、
  • 15、
  • 16、
  • 17、
  • 18、
  • 19、
  • 20、
  • 21、
  • 22、
  • 23、
  • 24、
  • 25、