1. ¡OFERTA! con cupón "DIRVPS": hosting por $0,01 y también VPS Linux y Windows por $0,01 el primer mes por Interserver ← publi
    Descartar aviso
Descartar aviso
Al usar este sitio web, aceptas que nosotros y nuestros socios podamos establecer cookies para fines tales como personalizar el contenido y la publicidad. Más información.

Servidor caido - Falla en disco?

Tema en 'Servidores Dedicados' iniciado por publi2010, 21 Ago 2014.

  1. publi2010

    publi2010 Nuevo usuario

    Hola a todos,

    Tengo un dedicado en Ovh (kimsufi) con soporte automatico (salta si no encuentra conectividad).

    Me encuentro con el servidor caido, lo reincio y detecta la no conectividad. Despues de un rato, se ve que algo tocaron, y me mandaron al modo rescue.

    No tengo claro que paso, cada vez que inicio me manda al rescue.

    CODE, HTML o PHP Insertado:
    root@rescue:~# fdisk -l
    
    Disk /dev/sda: 1000.2 GB, 1000204886016 bytes
    255 heads, 63 sectors/track, 121601 cylinders, total 1953525168 sectors
    Units = sectors of 1 * 512 = 512 bytes
    Sector size (logical/physical): 512 bytes / 512 bytes
    I/O size (minimum/optimal): 512 bytes / 512 bytes
    Disk identifier: 0x00000000
    
    Disk /dev/sda doesn't contain a valid partition table
    
    CODE, HTML o PHP Insertado:
    root@rescue:~# parted -l
    Error: /dev/sda: unrecognised disk label
    Model: ATA Hitachi HUA72201 (scsi)
    Disk /dev/sda: 1000GB
    Sector size (logical/physical): 512B/512B
    Partition Table: unknown
    Disk Flags:
    
    No tengo particiones?

    CODE, HTML o PHP Insertado:
    root@rescue:~# lspci
    00:00.0 Host bridge: Intel Corporation 2nd Generation Core Processor Family DRAM Controller (rev 09)
    00:02.0 VGA compatible controller: Intel Corporation 2nd Generation Core Processor Family Integrated Graphics Controller (rev 09)
    00:16.0 Communication controller: Intel Corporation 6 Series/C200 Series Chipset Family MEI Controller #1 (rev 04)
    00:19.0 Ethernet controller: Intel Corporation 82579V Gigabit Network Connection (rev 05)
    00:1a.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #2 (rev 05)
    00:1c.0 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 1 (rev b5)
    00:1c.1 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 2 (rev b5)
    00:1d.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #1 (rev 05)
    00:1f.0 ISA bridge: Intel Corporation H61 Express Chipset Family LPC Controller (rev 05)
    00:1f.2 SATA controller: Intel Corporation 6 Series/C200 Series Chipset Family SATA AHCI Controller (rev 05)
    00:1f.3 SMBus: Intel Corporation 6 Series/C200 Series Chipset Family SMBus Controller (rev 05)
    02:00.0 USB controller: NEC Corporation uPD720200 USB 3.0 Host Controller (rev 04)
    
    Creo que el disco no tiene errores:
    CODE, HTML o PHP Insertado:
    root@rescue:~#  smartctl -a -d ata /dev/sda
    smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.10.23-xxxx-std-ipv6-64-rescue] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Model Family:  Hitachi Ultrastar A7K2000
    Device Model:  Hitachi HUA722010CLA330
    Serial Number:  JPW9K0N201ZJKE
    LU WWN Device Id: 5 000cca 3a8c0e6fe
    Firmware Version: JP4OA3EA
    User Capacity:  1,000,204,886,016 bytes [1.00 TB]
    Sector Size:  512 bytes logical/physical
    Device is:  In smartctl database [for details use: -P show]
    ATA Version is:  8
    ATA Standard is:  ATA-8-ACS revision 4
    Local Time is:  Thu Aug 21 09:22:11 2014 EDT
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x82) Offline data collection activity
      was completed without error.
      Auto Offline Data Collection: Enabled.
    Self-test execution status:  (  0) The previous self-test routine completed
      without error or no self-test has ever
      been run.
    Total time to complete Offline
    data collection:  ( 9812) seconds.
    Offline data collection
    capabilities:  (0x5b) SMART execute Offline immediate.
      Auto Offline data collection on/off support.
      Suspend Offline collection upon new
      command.
      Offline surface scan supported.
      Self-test supported.
      No Conveyance Self-test supported.
      Selective Self-test supported.
    SMART capabilities:  (0x0003) Saves SMART data before entering
      power-saving mode.
      Supports SMART auto save timer.
    Error logging capability:  (0x01) Error logging supported.
      General Purpose Logging supported.
    Short self-test routine
    recommended polling time:  (  1) minutes.
    Extended self-test routine
    recommended polling time:  ( 164) minutes.
    SCT capabilities:  (0x003d) SCT Status supported.
      SCT Error Recovery Control supported.
      SCT Feature Control supported.
      SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME  FLAG  VALUE WORST THRESH TYPE  UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate  0x000b  100  100  016  Pre-fail  Always  -  0
      2 Throughput_Performance  0x0005  136  136  054  Pre-fail  Offline  -  93
      3 Spin_Up_Time  0x0007  100  100  024  Pre-fail  Always  -  237
      4 Start_Stop_Count  0x0012  100  100  000  Old_age  Always  -  8
      5 Reallocated_Sector_Ct  0x0033  100  100  005  Pre-fail  Always  -  0
      7 Seek_Error_Rate  0x000b  100  100  067  Pre-fail  Always  -  0
      8 Seek_Time_Performance  0x0005  138  138  020  Pre-fail  Offline  -  31
      9 Power_On_Hours  0x0012  100  100  000  Old_age  Always  -  21
    10 Spin_Retry_Count  0x0013  100  100  060  Pre-fail  Always  -  0
    12 Power_Cycle_Count  0x0032  100  100  000  Old_age  Always  -  8
    192 Power-Off_Retract_Count 0x0032  100  100  000  Old_age  Always  -  9
    193 Load_Cycle_Count  0x0012  100  100  000  Old_age  Always  -  9
    194 Temperature_Celsius  0x0002  206  206  000  Old_age  Always  -  29 (Min/Max 25/36)
    196 Reallocated_Event_Count 0x0032  100  100  000  Old_age  Always  -  0
    197 Current_Pending_Sector  0x0022  100  100  000  Old_age  Always  -  0
    198 Offline_Uncorrectable  0x0008  100  100  000  Old_age  Offline  -  0
    199 UDMA_CRC_Error_Count  0x000a  200  200  000  Old_age  Always  -  0
    
    SMART Error Log Version: 0
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    No self-tests have been logged.  [To run self-tests, use: smartctl -t]
    
    
    SMART Selective self-test log data structure revision number 1
    SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
      1  0  0  Not_testing
      2  0  0  Not_testing
      3  0  0  Not_testing
      4  0  0  Not_testing
      5  0  0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    Hago un testdisk, elijo analyse y me da esto:
    CODE, HTML o PHP Insertado:
    Disk /dev/sda - 1000 GB / 931 GiB - CHS 121601 255 63
    Current partition structure:
      Partition  Start  End  Size in sectors
    
    
    Partition sector doesn't have the endmark 0xAA55
    
    Se habra roto el disco?. O la particion?
    Que puedo hacer?
    Gracias de antemano.
    Saludos
     
  2.  
  3. Que dice el dmseg?
     
  4. publi2010

    publi2010 Nuevo usuario

    Como lo chequeo?
     
  5. dmseg | less
    tail -f /var/log/messages

    Estoi pensando que ovh igual te cambio el disco por que detectaba que daban problemas o te han hackeado el servidor y te han borrado todo por que no tienes particiones montadas ni nada. Lo más probable es que te lo hayan cambiado.
     
  6. Skamasle

    Skamasle Usuario activo

    :/

    Como bien a dicho lo mandan a modo rescue por eso no tiene nada y no tiene particiones montadas.

    Tiene que montar los discos y luego checarlo, si no solo verá el sistema rescue y con eso mismo no tendrá logs ni nada...
     
  7. Estaba un poco espesso. Efectivamente si no tiene las particiones montadas y el so no reconoce el disco no se puede almacenar información.

    Esto lo demuestra:
    Disk /dev/sda doesn't contain a valid partition table
    Error: /dev/sda: unrecognised disk label

    A mí lo que me extraña es que se desmonte sin más el disco. O le han hackeado y el hacker le ha borrado todo o OVH a cambiado los discos sin avisar.
     
  8. Skamasle

    Skamasle Usuario activo

    Modo rescue = discos desmontados.
     
  9. hostigal

    hostigal Usuario activo

    y el soporte de ovh, como fue al final..?

    saludos.
     
  10. jmginer

    jmginer Usuario activo

    Disco presente en rescue y sin fallos de SMART -> problema de software
     
  11. Ahora según me detengo a mirar parece que no se ha montado bien el sistema de ficheros:

    Disk /dev/sda doesn't contain a valid partition table | El disco /dev/sda no contiene una tabla de partición valida
    Error: /dev/sda: unrecognised disk label | Error /dev/sda: no reconoce la etiqueta de disco

    A mí parecer la tabla de particiones del disco no ha sido correctamente montado.

    Ha utilizado mkfs para crear el fichero?

    Salu2,
     
  12. OrlandJ

    OrlandJ Nuevo usuario

    yo creo que en este caso lo tienes complicado con ovh quizás acabad antes con un servidor nuevo

    yo tengo dos soyoustart en EEUU y siempre tengo en la cabeza que si me falla algo, cojo otro y muevo todo, porque segun he leido esta muy complicado el soporte alla.
     
  13. El problema no es del disco por que el smartctl no da errores de ningún tipo. Parece que esta todo correcto.

    Yo creo que no ha realizado bien la tabla de particiones y por eso ovh se lo pone en mode rescue para que las vuelva a crear. En este caso no es culpa de OVH.

    tiene que crear las particiones con mkfs para que el sitema las reconozca. Primero tiene que montar el disco con mount. Después fdisk y luego mkfs para darle formato.
     
  14. Te dejo un video para que aprendas:
     
  15. Skamasle

    Skamasle Usuario activo

    Eso simplemente puede ser por que tiene raid y no lo tiene ensamblado o bien simplemente por que tenga raid y lo este viendo en modo rescue..

    Al menos que se haya formateado solo, pero si esta funcionando bien el server es poco probable.

    Además con eso de recrear las particiones que lo formatee directamente que el resultado será el mismo, lo va a perder todo y tendrá que instalar el sistema...
     


Alojamiento web, Hosting Reseller, Servidores Dedicados - All in Hosting


    
    
    
    
Blog · Sitios amigos: GuiaHosting · Unidominios · Interalta ·