Filter by:

SSDとSMARTデータ

SMARTとは、Self-Monitoring, Analysis and Reporting Technologyの略語で、自己監視・分析・レポート技術を意味します。その名前が示すように、ハードドライブディスク(HDD)やソリッドステートドライブ(SSD)の正常性データを記録するツールです。SMARTデータは、ドライブに問題が生じている場合や、ドライブの耐用年数が満了した場合に早期に警告を発し、障害が発生する前に交換することを可能にする貴重なツールです。

ドライブ自体にはデータの詳細な分析機能がないため、ユーザーやシステム管理者に簡単に報告できる機能が重要です。ドライブは、特定の属性が既定のしきい値を超え、しかもそのしきい値がファームウェアでプログラミングされている場合にのみ報告することができます。

SMARTはSSDが誕生する何年も前から存在しています。SMARTはもともとHDDに実装されていましたが、スピニングハードドライブに完全に取って代わる新しい技術としてSSDが考案されると、SSDに適用されるようになりました。残念ながら、ストレージテクノロジーを問わず、ドライブの具体的な物理特性を示すSMART属性を示す番号に関する業界全体の標準はありません。属性記述子は、SSDとHDD間で、さらにはさまざまなSSDベンダー間で異なります。

ドライブのSMARTデータを取得し報告する機能を備えたさまざまなサードパーティ製ユーティリティが存在し、フリーウェアやシェアウェアとして提供されているものも多くありますが、サードパーティのソフトウェアベンダーが正しいSMART属性をドライブのベンダーに照会していなければ、その定義としきい値(該当する場合)は属性を誤って表記する可能性があり、それが誤検知または偽陰性の障害報告につながる可能性があります。

たとえば、「Power-on Hours Count」属性としてユーティリティに通知された数値が、互換性のないユーティリティでは「Program Fail Count」または「Reported Uncorrectable Errors」と誤って表示されるといった例が実際に見られました。さらに悪いことに、サードパーティ製のユーティリティで問題のSSDに不適切な障害しきい値が設定されているために、製造元が許容範囲と認識している段階でSMARTユーティリティが障害を報告する可能性があります。

このような混乱の可能性があるため、Crucial SSDのSMARTデータを正確に取得して分析するためのツールとして必ずStorage Executiveソフトウェアを使用することをお勧めします。Storage Executiveは、最初期のレガシーのCrucial SSDを除くすべてのCrucial SSDにおいて、常に正しい属性の説明としきい値(該当する場合)を用いてプログラミングされます。

Crucialの定義によるSMART属性の説明

Crucial SSDはStorage Executiveでの取得用に様々な種類の属性を記録します。SSDに関する重要な情報を報告する属性もあれば、あくまで参考用の属性もあります。

以下では特に重要な情報について説明し、SATAとPCleとで属性の名前が異なる場合には両方の名前を記載しています。

属性202:Percentage Lifetime Used

この属性の意味は名前が示すとおりです。これは、ある時点でドライブの予想寿命がどの程度経過したかを示す指標です。属性202は、SSDが新品の場合には「0」と報告され、所定の寿命に達すると「100」と表示されて寿命が100%経過したことが報告されます。

ただし、予想寿命が100%に達するということの意味を理解することが重要です。これは、このカウンターが101に転じるとドライブに障害が発生するということではなく、近いうちにSSDの交換が必要な可能性があることを意味します。

NANDフラッシュデバイスの寿命は、データリテンション(データ保持能力)という別の特性によって定義されます。データリテンションは、デバイスが電源のない状態でユーザーデータを安全に保存し、正常に取得できる時間です。SSDやその他のNANDフラッシュデバイスが新品の場合、無電源状態でのデータ保持期間は数年になります。しかし、人間の記憶と同様に、データを書き込むことによる摩耗が生じるにつれてデータ保持期間は短くなります(データの読み取りによって直接摩耗が生じることはありません)。

電子デバイス技術合同協議会(JEDEC)は半導体ベースのデバイスおよびアセンブリの標準と仕様を策定する業界団体です。マイクロンが主要メンバーとして参加しているJEDECでは、クライアント用(ビジネスコンピュータやパソコンなど)のSSDの場合、SSDのデータ保持期間は30 °C(86 °F)での無電源状態で1年間とする、とデータ保持期間を具体的に定義しています。これだけの時間的余裕があれば、多くのコンピューターユーザーはしばらく未使用のまま放置されていたドライブから必要に応じてデータを取得することができます。

寿命カウンターは100%から始まるため、この説明から、SSDの正常な機能が期待できることがわかります。ただし、時間が経つにつれ、データ保持期間は1年から6 か月、3 か月という具合に低下し続けます。保証されているドライブの寿命から長期間経過すると、やがては無電源状態では新しい書き込みは保持できなくなりますが、

SSDファームウェアではこの点が考慮されています。エラー訂正コード(ECC)、読み取り再試行、適応型の読み取りパラメーター、バックグラウンドデータ保守といったファームウェアの調整により、SSDの経年に伴うデータ保持能力の劣化が原因で発生する問題を修正できます。NANDデータブロックが劣化した場合には、オンボードのスペアに交換して通常の処理を続行することができます。もちろん、これらのバックグラウンド処理はすべて電源が投入された状態で行われるので、データリテンションは無電源状態で定義されています。

属性5:Retired NAND Blocks

NANDブロックの品質を継続的に評価するこのプロセスでリタイアしたブロックの数は、SMART属性5で追跡されます。SSDのファームウェアは、上記の摩耗とデータ保持の問題に加えて、いくつかの理由でNANDブロックをリタイアします。リタイアの理由の1つとして、ガベージコレクションでデータを削除または移動する際にブロックを消去できなかったことが挙げられます。問題のデータは削除されているか、SSD上の新しい場所に既に正常にコピーされているため、この種のエラーはユーザーデータにとっては低リスクです。

属性180:Unused Reserved Block Count(PCIe SSDで使用可能なスペアブロックの数)

繰り返しになりますが、これは名前が示すように、不良ブロックをリタイアする必要がある場合に使用可能な予備ブロックの数です。この数字は基本的なNANDアーキテクチャー、ファームウェアアーキテクチャー、およびドライブのユーザー容量によって異なりますが、通常は数千単位から始まります。

リタイアしたブロックの数が増えるにつれ、この数は減少します。属性180が0に達すると、ファームウェアはSSDを読み取り専用モードにします。SSDは正常なドライブとして使用できなくなりますが、ユーザーは保存されたデータを取得して新しいデバイスに転送することが可能です。この数値が100を下回った場合は、ドライブを交換することを強くお勧めします。

属性210:RAIN Successful Recovery Page Count

Redundant Array of Independent NAND (RAIN)は、ドライブアレイでRAIDを用いてデータの冗長性を確保する場合とよく似ていますが、RAINによる冗長化はユーザーに対して透過的にドライブ内で行われる点が異なります。RAINはユーザーデータを保護し、ドライブの寿命を延ばすためにSSDで用いられる機能です。

RAINイベントが発生することはまれであるため、この値が大きくなったら、前述の属性のいくつかを調べて、ドライブを交換する必要があるかどうかを確認してください。RAINイベントが頻繁に発生すると、パフォーマンスが著しく低下する可能性があります。パリティによる冗長化を用いてデータをリカバリすると、通常のドライブ操作を続行できますが、一定のI/O帯域幅が消費されます。パフォーマンスが頻繁に低下する場合は、RAINの再構築が原因である可能性があり、問題の原因になります。

属性174:Unexpected Power Loss Count(PCIe SSDでの安全でないシャットダウンの回数)

コンピューターシステムの正常な電源途絶の前には、ホストコンピューターからSSDに対して電源が切れようとしているというメッセージが通知されます。この警告により、SSDには進行中のアクティビティを完了するための時間が与えられます。アクティビティが完了すると、SSDはホストに「確認応答」メッセージを送信し、ホストはシャットダウンを完了します。

予期しない状況で電源が途絶することは多く、SSDの問題を引き起こす原因となります。ほとんどの場合、SSDではこれを補正することが可能で、次回の起動時間が少し長くなる可能性はありますが(数百ミリ秒ではなく数秒)、システムは再び起動します。

属性174は通常、あくまで参考値として用意されていますが、このようなイベントの数が多い場合は、ユーザーが適切なオペレーティングシステムのシャットダウンに関するトレーニングを受ける必要があるか、電源装置または接続に問題がある可能性があることを示している場合があります。

属性194:Enclosure Temperature(PCIeのデバイスの温度)

Crucial Storage Executiveソフトウェアは、SSDのセンサーで測定された現在の温度と最高寿命温度を摂氏で報告します。多くのCrucial SSDで指定されている動作範囲は0°C~70°C(32°F~158°F)です。記録された温度が70°Cを超えると製品保証が無効になる可能性があるため、温度は定期的に監視する必要があります。温度が定期的に65°Cを超える場合は、換気やファンの改善などの是正措置をお勧めします。

まとめ

SMARTはSSDの健全性を監視する非常に便利なツールになり得ますが、包括的な診断ツールではありません。SMART属性とオペレーティングシステムの診断から収集された情報は標準的なトラブルシューティングの出発点として役立ちます。

SMARTデータの誤った報告または解釈は誤った結論を導く原因となり、完全に機能しているドライブの返品につながりかねません。そのため、繰り返しになりますが、Crucial SSDからSMARTデータを読み取る場合は必ずCrucial Storage Executiveソフトウェアを使用することをお勧めします。

©2019 Micron Technology, Inc. All rights reserved. 情報、製品および仕様は予告なく変更される場合があります。CrucialおよびMicron Technology, Inc.はいずれも、印刷や写真における不備またはエラーについて一切の責任を負いません。Micron、Micronのロゴ、Crucial、Crucialのロゴは、Micron Technology, Inc.の商標または登録商標です。PCI ExpressおよびPCIeはPCI-SIGの登録商標です。その他の商標およびサービスマークはすべて、その所有者に帰属します。