Como detectar se um disco está procurando?

16

Posso usar uma variedade de ferramentas para medir o volume de E / S do disco atualmente fluindo pelo sistema (como iotope iostat), mas estou curioso para saber se é possível detectar facilmente se um disco está buscando muito com apenas uma pequena quantidade de E / S.

Eu sei que é possível extrair essas informações usando-as blktracee decodificá-las usando-as, bttmas estas são um tanto difíceis de manusear e eu esperava que houvesse uma alternativa mais simples?

Gearoid Murphy
fonte
4
Coloque seu ouvido perto do seu disco? :)
terdon
2
Uma proporção baixa não (rkB/s + wkB/s)/%utilsignifica que o disco está buscando (entrada iostat -x)?
23313 Marco
11
Deseja uma ferramenta que mostre isso ao vivo ou deseja ver os dados durante um determinado período de tempo?
slm
11
AFAIK, kernel.org/doc/Documentation/iostats.txt são as únicas estatísticas mantidas pelo kernel, então não espero que você ache melhor que o blktrace.
Stéphane Chazelas

Respostas:

4

A proporção (rkB/s + wkB/s)/%utilda iostat -xsaída deve fornecer algumas dicas:

Device:  rrqm/s wrqm/s   r/s   w/s  rkB/s  wkB/s avgrq-sz avgqu-sz await r_await w_await  svctm  %util
sda        0.04   3.65  7.16  6.37 150.82 212.38    53.71     0.03  1.99    0.82    3.31   0.76   1.03

Não tenho certeza de como exatamente essa proporção corresponde à busca do disco. Mas a idéia é que, se o disco estiver ocupado e não tiver uma alta taxa de transferência, provavelmente está procurando. No entanto, não é garantido. Os discos quebrados às vezes mostram uma alta utilização e quase não têm taxa de transferência. Mas é pelo menos um indicador.

Você também pode fornecer um número ao iostat (por exemplo iostat -x 5) para especificar o intervalo de atualização. Dessa forma, você pode monitorar continuamente.

Marco
fonte
Presumivelmente, muitos pedidos de leitura emparelhados contra um rkB baixo / s seria indicativo de tal situação um
Gearoid Murphy
8

Não tenho certeza se você está procurando ferramentas que mostram esse tipo de informação em tempo real ou por um período de tempo, mas aqui estão duas ferramentas que mostram os aspectos em tempo real do disco que está sendo acessado.

não

Você invoca assim nmon,. Depois que estiver aberto, pressione j(Sistemas de arquivos) seguido de d(Gráficos de E / S de disco D = Estatísticas). Veja a ajuda embutida ( h) para mais detalhes.

$ nmon
┌nmon─13g─────────────────────Hostname=manny────────Refresh= 2secs ───11:15.32─────────────────────────────────────────────────────┐
│ Filesystems ─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────│
│Filesystem            SizeMB  FreeMB %Used Type     MountPoint                                                                    │
│v/mapper/ubuntu-root 465389.0 457483.9   1.7 ext4     /                                                                           │
│/proc                                      proc     not a real filesystem                                                         │
│/sys                                       sysfs    not a real filesystem                                                         │
│/sys/fs/fuse/connections                   fusectl  not a real filesystem                                                         │
│/sys/kernel/debug                          debugfs  not mounted                                                                   │
│/sys/kernel/security                       security not a real filesystem                                                         │
│/dev                                       devtmpfs not a real filesystem                                                         │
│/dev/pts                                   devpts   not a real filesystem                                                         │
│tmpfs                  740.5   739.4   0.1 tmpfs    /run                                                                          │
│none                     5.0     5.0   0.0 tmpfs    /run/lock                                                                     │
│none                  1851.2  1849.8   0.1 tmpfs    /run/shm                                                                      │
│none                   100.0    99.9   0.1 tmpfs    /run/user                                                                     │
│/dev/sda1              910.9   606.5  33.4 ext2     /boot                                                                         │
│/run/rpc_pipefs                            rpc_pipe fstatfs returned zero blocks!!                                                │
│/run/user/emma/gvfs                        fuse.gvf not mounted                                                                   │
│/run/user/emily/gvfs                       fuse.gvf not mounted                                                                   │
│ Disk I/O ──/proc/diskstats────mostly in KB/s─────Warning:contains duplicates─────────────────────────────────────────────────────│
│DiskName Busy  Read WriteMB|0          |25         |50          |75       100|                                                    │
│sda      100%    0.0   66.4|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│sda1       0%    0.0    0.0|>                                                |                                                    │
│sda2       0%    0.0    0.0|>                                                |                                                    │
│sda5     100%    0.0   66.4|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│dm-0     100%    0.0   48.0|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│dm-1       0%    0.0    0.0|                     >                           |                                                    │
│Totals Read-MB/s=0.0      Writes-MB/s=180.9    Transfers/sec=363.2                                                                │
│──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────│

Outra ferramenta que encontrei que faz pelo menos uma visualização ao vivo da E / S do disco é atop.

$ atop
ATOP - grinchy                           2013/08/23  11:10:58                           ------                           10s elapsed
PRC | sys    2.18s  | user  26.26s  | #proc    315  | #trun  5 |  #tslpi   764 |  #tslpu     1 |  #zombie    0 |  #exit  1 |
CPU | sys      22%  | user    264%  | irq       0%  | idle    110% |  wait      4% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     76%  | irq       0%  | idle     19% |  cpu003 w  0% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     67%  | irq       0%  | idle     26% |  cpu001 w  2% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     62%  | irq       0%  | idle     31% |  cpu000 w  1% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys   7%  | user     58%  | irq   0%  | idle     34% |  cpu002 w  1% |  guest     0% |  curf 1.20GHz |  curscal  44% |
CPL | avg1    3.83  | avg5    4.59  | avg15   4.76  |              |  csw    54101 |  intr   45315 |               |  numcpu     4 |
MEM | tot     7.6G  | free  194.3M  | cache 495.5M  | dirty   2.7M |  buff   38.9M |  slab   86.7M |               |               |
SWP | tot     5.7G  | free    5.5G  |               |              |               |               |  vmcom  12.4G |  vmlim   9.5G |
LVM | nchy-lv_home  | busy     11%  | read       1  | write    524 |  KiB/w      3 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 2.05 ms |
LVM | nchy-lv_root  | busy      1%  | read       0  | write      7 |  KiB/w  4 |  MBr/s   0.00 |  MBw/s   0.00 |  avio 9.00 ms |
DSK |          sda  | busy     11%  | read       1  | write    109 |  KiB/w 19 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 10.3 ms |
NET | transport     | tcpi  72  | tcpo     118  | udpi      15 |  udpo   5 |  tcpao     11 |  tcppo      0 |  tcprs      0 |
NET | network       | ipi       87  | ipo      123  | ipfrw      0 |  deliv     87 |               |  icmpi      0 |  icmpo      0 |
NET | wlan0   ----  | pcki      88  | pcko     123  | si   34 Kbps |  so   19 Kbps |  erri       0 |  erro       0 |  drpo       0 |

  PID  RUID       EUID       THR    SYSCPU    USRCPU   VGROW    RGROW    RDDSK   WRDSK   ST   EXC  S   CPUNR    CPU  CMD         1/4
 3649  saml       saml        34     0.33s    11.98s      0K    1752K       4K   2828K   --     -  R       2   122%  chrome
10399  saml       saml         4     0.14s     3.08s   5120K   -12.8M       0K      0K   --     -  S       2    32%  chrome

Especificamente, estas linhas que estão mostrando a atividade LVM e DSK:

    LVM | nchy-lv_home  | busy     11%  | read       1  | write    524 |  KiB/w      3 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 2.05 ms |
    LVM | nchy-lv_root  | busy      1%  | read       0  | write      7 |  KiB/w  4 |  MBr/s   0.00 |  MBw/s   0.00 |  avio 9.00 ms |
    DSK |          sda  | busy     11%  | read       1  | write    109 |  KiB/w 19 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 10.3 ms |

iostat

Se você estiver interessado nos dados por um período de tempo, iostatainda é provavelmente a sua melhor opção, agrupada em um script. Você pode se livrar da saída de utilização, para que seja mais fácil lidar com:

$ iostat -dx /dev/sda 5
Linux 2.6.35.14-106.fc14.x86_64 (grinchy)   08/23/2013  _x86_64_    (4 CPU)

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               1.82    96.60    3.84   20.68   122.26   891.99    41.36     0.46   18.77   7.35  18.01

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.00    26.20    1.60   24.60    17.60   350.40    14.05     0.31   11.95   8.84  23.16

Diretamente do Kernel

Este bloco de código (bash) mostrará as E / Ss lidas processadas diretamente do Kernel.

OLD=`awk '{print $1}' /sys/block/sda/stat` # First field is number of read I/Os processed
DT=1
for ii in `seq 1 10`
do
    sleep $DT
    NEW=`awk '{print $1}' /sys/block/sda/stat`
    echo $((($NEW-$OLD)/$DT))
    OLD=$NEW
done

fonte: /server//a/525248/2518

A informação também pode ser tido a partir de qualquer /sys/block/sda/statou /proc/diskstatsem situações em que você não pode ou não deseja instalar quaisquer ferramentas.

Referências

slm
fonte
Obrigado pela resposta detalhada, mas as métricas que você forneceu ainda são I / O focado, idealmente, eu gostaria de ver em disco buscar atividade independentemente de I / O
Gearoid Murphy
@GearoidMurphy - não encontrei uma maneira de obter esse tipo de dados de telemetria sobre acessos ao disco fora da E / S.
slm
Eu acho que Marco acertou em um comentário acima, a solução seria olhar para a proporção de transações em disco para o volume real de dados lidos / gravados.
Gearoid Murphy
11
@GearoidMurphy - é por isso que pedi esclarecimentos nos comentários sobre se você queria um tipo de solução em tempo real ou um período de tempo. Se você encontrar uma solução viável, eu a escreveria como resposta e a aceitaria. Não havia muito quando se procurava sua inclinação específica sobre isso.
slm