Innovative memory and storage solutions direct from Micron for 45 years.

ストレージに関するよくある質問

SSDとSMARTデータ

Crucialサポートチーム | 2024年11月15日

プレースホルダーの画像

SSDとSelf-Monitoring and Reporting Technology(SMART)データ

Self-Monitoring and Reporting Technology(SMART)とは、Self-Monitoring, Analysis and Reporting Technologyの略です。名前が示すように、ハードディスク(HDD)またはSSD(SSD)の健全性データを記録するツールです。Self-Monitoring and Reporting Technology(SMART)データは貴重なツールであり、ドライブに問題がある場合や寿命が過ぎた場合に早期警告を提供し、故障前に交換する可能性があります。

ユーザーまたはシステム管理者への簡単な報告は重要です。ドライブ自体はデータを詳細に分析できないためです。ドライブは、特定の属性が事前に定義されたしきい値を超えた場合にのみレポートでき、しきい値がファームウェアでプログラムされている場合にのみレポートできます。

Self-Monitoring and Reporting Technology(SMART)は長年にわたりSSDの誕生より前から存在しています。Self-Monitoring and Reporting Technology(SMART)は元々HDDに実装され、この新しいテクノロジーが回転ハードディスクのドロップイン代替として発明されたときにSSDに適応されました。残念ながら、ストレージテクノロジーにかかわらず、ドライブの特定の物理的特性を表すSMARTSelf-Monitoring and Reporting Technology(SMART)属性を業界全体で示す規格はありません。属性ディスクリプタは、SSDとHDD、さらにはSSDベンダーによっても異なります。

ドライブのSelf-Monitoring and Reporting Technology(SMART)データを取得してレポートできるサードパーティのユーティリティがいくつかあります。多くの場合、フリーウェアやシェアウェアで利用できます。ただし、サードパーティのソフトウェアベンダーがドライブベンダーと正しいSelf-Monitoring and Reporting Technology(SMART)属性について相談しない限り、その定義としきい値(該当する場合)は属性のラベル付けを誤る可能性があり、誤検出または誤陰性の故障レポートにつながる可能性があります。

これまで、「電源オン時間数」属性がユーティリティに数値を報告し、互換性のないユーティリティがその数値に「プログラム障害数」または「訂正不能エラーの報告」と誤ってラベル付けする例を見てきました。さらに悪いことに、サードパーティのユーティリティには、問題のSSDに不適切な故障しきい値がある可能性があるため、Self-Monitoring and Reporting Technology(SMART)ユーティリティはメーカーが許容可能な動作であると認識した時点で故障を報告します。

この混乱の可能性があるため、Crucial SSDのSelf-Monitoring and Reporting Technology(SMART)データを正確に取得して分析するためのツールとして、Storage Executiveソフトウェアのみを使用することをお勧めします Crucial 。Storage Executiveは、最も古いレガシーCrucial SSDを除くすべての製品について、常に正しい属性の説明としきい値(該当する場合)でプログラムされます。

Crucial定義のSelf-Monitoring and Reporting Technology(SMART)属性の説明

Crucial SSDは、Storage Executiveが取得するためのいくつかの異なる属性を記録します。一部の属性はSSDに関する重要な情報を報告し、他の属性は情報提供のみを目的としています。

以下では特に重要な属性について説明します。ここでは、SATAとPCleとで属性の名前が異なる場合は両方の名前を記載しています。

属性202:残存寿命の割合(PCIeで使用される寿命の割合)

この属性は、その名前が示すとおりです。これは、ドライブの予測寿命がどの時点でもどれくらい残っているかを示す指標です。SSDが新品の場合、Attribute 202は「100」を報告し、指定された寿命に達すると「0」と表示され、寿命の0%が残っていると報告されます。

ただし、予測寿命を使用することの意味を理解することが重要です。つまり、カウンタがゼロになったときにドライブが故障するわけではなく、SSDをすぐに交換する必要があるということです。

NANDフラッシュデバイスの寿命は、データ保持という別の特性によって定義されます。データ保持とは、デバイスが無電力状態でユーザーデータを安全に保存し、正常に取得できる時間のことです。SSDやその他のNANDフラッシュデバイスが新品である場合、無電力データ保持は数年になります。しかし、人間のメモリとほぼ同じく、データを書き込むことで、摩耗や破損が発生すると短くなります(データ読み取りは直接摩耗を引き起こさない)。

電子デバイス技術合同協議会(JEDEC)は、半導体ベースのデバイスとアセンブリの規格と仕様を作成する業界グループです。マイクロンはJEDECのリーディングメンバーです。JEDECは、特定の方法でデータ保持を定義します。クライアントアプリケーション(業務用コンピューターやパーソナルコンピューターなど)のSSDの場合、SSDのデータ保持は、30°C(86°F)で保存され、無電力状態で1年間とします。これにより、ほとんどのコンピューターユーザーは、必要に応じて、棚にしばらく置いた後に未使用のドライブからデータを取得するのに十分な時間を確保できます。

この説明から、SSDは非常にうまく機能することが期待でき、寿命カウンターは100%から数えられることがわかるかもしれません。しかし、時間が経つにつれて、データ保持は1年から6か月、3か月へと低下し続けます。最終的に、ドライブの保証寿命をはるかに超えると、電源が入っていない間は、新しい書き込みはまったく保持できなくなります。

ただし、SSDファームウェアではこの点が考慮されます。SSDの経年劣化に伴い、エラー訂正コード(ECC)、読み取りリトライ、適応型読み取りパラメータ、バックグラウンドデータメンテナンス、ファームウェアのその他の調整により、徐々にデータ保持が劣化して発生する問題が修正される可能性があります。NANDデータブロックが劣化すると、オンボードのスペアに交換でき、通常の操作を続行できます。もちろん、これらのバックグラウンド操作はすべて電源がオンのときに行われます。そのため、データ保持は無電力状態で定義されます。

この属性は、特定のレガシーCrucial SSDおよびNVMeモデルでは「使用寿命の割合」とも呼ばれ、寿命の残りと同様に動作しますが、逆のみです。新しいSSDの属性202は「0」と報告され、指定された寿命に達すると「100」と表示され、寿命の100%が使用されたと報告されます。これらのモデルでは、書き込み操作が増えるとパーセンテージが100を超えることがありますが、データ保持に関する懸念は同じです。

属性5:廃止されたNANDブロック

NANDブロックの品質を継続的に評価するこのプロセスで廃止されたブロックの数は、Self-Monitoring and Reporting Technology(SMART)属性5で追跡されます。SSDファームウェアは、上記の摩耗とデータ保持の問題に加えて、いくつかの理由でNANDブロックを廃止します。退職の理由の一つは、ガベージコレクション中にデータを削除したり、データを移動したりする際にブロックを消去できないことです。このタイプの故障は、問題のデータが削除されているか、SSD上の新しい場所に正常にコピーされているため、ユーザーデータへのリスクが低くなります。

新しいCrucial SSDは、この属性でスーパーブロックを測定します。この属性は、多くの個々のブロックのグループです。属性5が測定する場合、ブロックの合計は、多くの個々のブロックが廃止されるまで増加しません。

属性180:未使用予約ブロック数(PCIe SSDで利用可能なスペアブロック)

繰り返しますが、名前が示すように、不良ブロックを廃止する必要がある場合に使用できる追加ブロックの数です。この数は、基盤となるNANDアーキテクチャー、ファームウェアアーキテクチャー、ドライブのユーザー容量によって異なりますが、通常は数千から始まるものです。

この数は、リタイアされたブロックの数が増えると減少します。属性180が0に達すると、ファームウェアはSSDを読み取り専用モードにします。SSDは通常のドライブとしては使用できませんが、ユーザーは保存されたデータを取得して新しいデバイスに転送できるはずです。

属性5と同様に、新しいCrucial SSDもこの属性でスーパーブロックを測定します。つまり、このブロックの合計は、多くの個々のブロックが廃止されるまで減少せず、従来の部品よりもはるかに低い値が反映されます。

属性210:RAINの正常な回復ページ数

Redundant Array of Independent NAND(RAIN)は、ドライブアレイのRAIDを使用してデータの冗長性を獲得するのと非常によく似ています。ただし、RAIN冗長性はドライブ内で、ユーザーに対して透過的に実行されます。RAINは、SSDがユーザーデータを保護し、ドライブの寿命を延ばすために使用される機能です。

RAINイベントは稀であるため、この数が大きくなると、上記の属性の一部を調べて、ドライブを交換する必要があるかどうかを確認する時が来ました。頻繁にRAINが発生すると、パフォーマンスが著しく低下することがあります。パリティ冗長性を使用してデータを回復することで、通常のドライブ動作を継続できますが、ある程度のI/O帯域幅を消費します。パフォーマンスの低下が頻繁に発生する場合は、RAINの再構築が原因である可能性があり、懸念を引き起こす可能性があります。

属性174:予期しない電力損失数(PCIe SSDの安全でないシャットダウン数)

コンピューターシステムの通常の電力損失の前には、ホストコンピューターからSSDに電力が落ちようとしているというメッセージが表示されます。この警告は、SSDが進行中のアクティビティを完了する時間を示します。完了すると、SSDはホストに「確認」メッセージを送信し、ホストはシャットダウンを終了します。

予想外に電源が切れる状況は多く、SSDに問題が生じる可能性がありますSSD。ほぼすべての状況で、SSDはこれを補正できますが、次の起動時間は少し長くなることがあります(数百ミリ秒ではなく数秒)が、システムは再び起動します。

属性174は通常、情報提供のみを目的としています。ただし、このようなイベントが多数発生すると、ユーザーが適切なオペレーティングシステムのシャットダウンについてトレーニングを受ける必要があること、または電源や接続に問題がある可能性があります。

属性194:エンクロージャ温度(PCIeのデバイス温度)

Crucial Storage Executiveソフトウェアは、SSDのセンサーで測定された現在の温度と最高寿命温度を摂氏で報告します。ほとんどのCrucial SSDの指定動作範囲は、0°C~70°C(32°F~158°F)です。70°Cを超える温度を記録した場合、製品保証が無効になる可能性があるため、温度を定期的に監視する必要があります。温度が定期的に65°Cを超える場合は、換気やファンの改善などの是正措置が推奨されます。

最後に考えること

Self-Monitoring and Reporting Technology(SMART)は、SSDの健全性を監視するための非常に便利なツールです。ただし、Self-Monitoring and Reporting Technology(SMART)は包括的な診断ツールではありません。Self-Monitoring and Reporting Technology(SMART)属性から収集された情報とオペレーティングシステムの診断は、標準的なトラブルシューティングの実践の出発点として最適です。

Self-Monitoring and Reporting Technology(SMART)データを誤って報告したり、誤って解釈したりすると、誤った結論につながり、残念ながら、完全に機能するドライブが戻ってくる可能性があります。そのため、Crucial Crucial SSDからSelf-Monitoring and Reporting Technology(SMART)データを読み取るためにCrucial Storage Executiveソフトウェアのみを使用することを強く推奨します。

 

©2019 Micron Technology, Inc. 無断複写・転載を禁じます。情報、製品、仕様は予告なく変更される場合があります。CrucialとMicron Technology, Inc.はいずれも、印刷物または写真における不備または誤りについて一切の責任を負いません。マイクロン、マイクロンのロゴ、Crucial、Crucialのロゴは、Micron Technology, Inc.の商標または登録商標です。 PCI ExpressおよびPCIeは、PCI-SIGの登録商標です。その他の商標およびサービスマークはすべて、その所有者に帰属します。