Backblaze vê aumento nas taxas de falha do disco rígido

blog

LarLar / blog / Backblaze vê aumento nas taxas de falha do disco rígido

Apr 27, 2024

Backblaze vê aumento nas taxas de falha do disco rígido

Por Andy Patrizio, Network World | Andy Patrizio é redator freelance de tecnologia que mora em Orange County, Califórnia. Ele escreveu para uma variedade de publicações, desde Tom's Guide até Wired até

Por Andy Patrizio, Network World |

Andy Patrizio é redator freelance de tecnologia que mora em Orange County, Califórnia. Ele escreveu para uma variedade de publicações, desde Tom's Guide to Wired até Dr. Dobbs Journal.

O último relatório trimestral da Backblaze sobre a confiabilidade do disco rígido revela um aumento nas falhas entre determinadas unidades.

Backblaze é um provedor de armazenamento puro; o armazenamento em nuvem é tudo o que eles fazem, e eles se aprofundam nas estatísticas de falhas no disco rígido e compartilham seus dados com a indústria. A empresa possui atualmente um enorme estoque de 241.297 unidades de disco rígido de diversas capacidades e de diversas marcas. (Nos últimos trimestres, a Backblaze adicionou desempenho de SSD às suas medições, mas os SSDs ainda estão no início de seu ciclo de vida de implantação, portanto, os padrões ao longo do tempo ainda não emergiram totalmente.)

No segundo trimestre de 2023, a empresa relatou uma taxa média de falhas (AFR) de 2,28%, o que representa um aumento considerável em relação aos 1,54% do trimestre anterior. Mas as falhas não ocorreram de forma generalizada. A empresa observou que as unidades de 8 TB e 10 TB estavam prejudicando os números.

Os piores infratores foram uma unidade Toshiba de 8 TB com AFR de 19,63%; uma unidade Seagate de 14 TB com AFR de 14,28%; uma unidade HGST de 8 TB com AFR de 13,53%; uma unidade Seagate de 10 TB com AFR de 12,31%; e uma segunda unidade Seagate de 14 TB com AFR de 10,25%.

A Seagate registrou taxas de falhas muito ruins em geral; é responsável pela maior parte do inventário do Backblaze e, portanto, por suas falhas. As taxas de falha da Western Digital nunca ultrapassaram 1% AFR. Além da unidade de 8 TB, as unidades da Toshiba tiveram um bom desempenho e nunca ultrapassaram 2% de AFR.

Backblaze observa que as falhas são uma realidade no armazenamento em nuvem:

“É claro que gostaríamos de vê-los mais baixos, mas a realidade inevitável do negócio de armazenamento em nuvem é que as unidades falham. Ao longo dos anos, observamos uma ampla variedade de taxas de falhas em diferentes fabricantes, modelos e tamanhos de drives. Se você não estiver preparado para isso, você irá falhar. Como parte de nossa preparação, usamos nossos dados de estatísticas de unidade como uma das muitas informações para entender nosso ambiente, para que possamos ajustar quando e como precisarmos”, escreveu Andy Klein, principal contador de histórias de armazenamento em nuvem da Backblaze, em uma postagem no blog sobre o estatísticas de movimentação trimestrais mais recentes. “Então, estamos preocupados com o aumento nas taxas de falhas de drives? Não, mas também não somos arrogantes. Continuaremos monitorando nossos sistemas, tomando medidas quando necessário e compartilhando o que pudermos com você ao longo do caminho.”

Dado que a idade média das unidades do Backblaze é superior a 60 meses, parece que sua vida útil é a melhor possível. Cinco anos é um desempenho muito bom para um disco rígido, especialmente aquele que é lido principalmente e com muito pouca gravação.

Mas gostaria de compartilhar outra observação que pode estar relacionada.

Tenho notado uma tendência entre amadores e construtores de sistemas que dizem que o hardware mais novo está sendo vendido relativamente rápido. Um integrador de sistemas me disse que notou uma queda na qualidade, com uma taxa de falhas anormalmente alta em todos os componentes. O que o intrigou é que o equipamento não falhou imediatamente; em vez disso, estava falhando após cerca de um ou dois anos de uso. O hardware normalmente falhará imediatamente ou durará sua vida útil normal, exceto algum tipo de evento traumático, como uma oscilação de energia.

O construtor do sistema teorizou que a qualidade caiu durante a pandemia de Covid e problemas relacionados na cadeia de abastecimento, e que o equipamento que está falhando agora pode ter sido construído por volta de 2021, o auge da pandemia.

É claro que um jogador que constrói um PC é diferente de um provedor de armazenamento em nuvem, mas ambos usam unidades feitas no mesmo lugar. Poderia haver um lote ruim de discos rígidos feitos há cerca de dois anos? Nesse caso, talvez todas as unidades que iriam falhar tenham falhado. Será interessante ver se o AFR do Backblaze voltará ao normal no próximo trimestre.