HotStorage 2023 要約
HotStorage 2023 の発表を要約してみた。(ChatGPTが)
HotStorage 2023 : https://www.hotstorage.org/2023/index.html
ChatGPTプロンプト:
これから、論文を1つずつ要約し、論文タイトル、著者と所属、概要を1000字程度でまとめていただきます。
こちらから「次へ」と言ったら、最初の論文から1つずつ順番に、要約してください。
対象の論文は以下の通りです。
・・・・
論文タイトル: When F2FS Meets Compression-Based SSD!
著者と所属: Yunpeng Song, Yiyang Huang, Yina Lv, Yi Zhang, Liang ShiB, School of Computer Science and Technology, East China Normal University, Shanghai, China
概要:
この論文では、F2FS(Flash-Friendly File System)と圧縮ベースのSSD(Solid State Drive)の組み合わせについて研究が行われています。F2FSは、NANDフラッシュベースのストレージの寿命を最大化するために圧縮をサポートしています。一方、高性能で透明性があり、容易に採用できる圧縮ベースの計算SSD(CSD)も開発されています。
この論文では、まずF2FSとCSDの圧縮を研究し、その特性を理解します。次に、F2FSとCSDの組み合わせに基づいて、パフォーマンスと電力消費を最適化するための協調圧縮(COCO)が提案されています。実デバイス上での実験結果から、COCOが最適化を促進することが示されています。
COCOは、CSDの電力消費を減らすための特徴認識圧縮スケジューリング方法と、F2FSのパフォーマンスを向上させるためのオンデマンド空間割り当てスキームを提案しています。これらの手法により、CSDの電力消費を削減し、ガベージコレクションのオーバーヘッドを減らすことでパフォーマンスを向上させることができます。
この研究は、F2FSとCSDの組み合わせによる圧縮の利点を最大化するための新たな手法を提供しており、ストレージシステムのパフォーマンスと電力効率の向上に寄与する可能性があります。
論文タイトル: Neural Cloud Storage: Innovative Cloud Storage Solution for Cold Video
著者と所属: Jinyeong Lim, Juncheol Ye, Jaehong Kim, Hwijoon Lim, Hyunho Yeo, Dongsu Han (KAIST)
要約:
この論文では、Neural Cloud Storage (NCS)という新しいクラウドストレージソリューションを提案しています。NCSは、ニューラルネットワークの強化、特にコンテンツに応じた超解像度(SR)を適用することで、頻繁にアクセスされない「冷たい」ビデオの問題に対処します。NCSは、最も安価なAWSストレージサービスに比べて年間14%の総所有コスト(TCO)を節約する可能性があります。これにより、マルチティアサービスから利益を得ることができる冷たいビデオの範囲を25%から38%に拡大します。ディープラーニングと計算リソースが進化し続ける中で、著者らはニューラル強化がクラウドストレージの分野を革新すると考えています。
この研究は、ビデオのストレージと取り出しのコストを最適化するための新しいアプローチを提供します。特に、頻繁にアクセスされないビデオ(冷たいビデオ)のストレージコストを削減するための効果的な手段を示しています。これは、クラウドストレージのコスト効率性を向上させ、ユーザーにとってより価値のあるサービスを提供する可能性があります。
論文タイトル: Do we still need IO schedulers for low-latency disks?
著者と所属: Caeden Whitaker, Sidharth Sundar, Bryan Harris, Nihat Altiparmak (Dept. of Computer Science & Engineering, University of Louisville)
要約: この論文では、データストレージデバイスの性能が大幅に向上し、低遅延、高スループット、高並列性を実現している現代において、IOスケジューラーが必要かどうかについて問いかけています。特に、10マイクロ秒未満でデータを提供できる超低遅延(ULL)データストレージデバイスが存在する現在、IOスケジューラーがパフォーマンスやエネルギー効率の向上に寄与するかどうかを検証しています。LinuxのIOスケジューリングアルゴリズムの遅延コストを測定し、ULLストレージデバイス、電力メーター、さまざまなIOワークロードを使用して全体的なパフォーマンスとエネルギー効率に対する影響を調査しています。その結果、ULLストレージに対するIOスケジューラーは、リクエストの遅延を大幅に増加させるか、または全く助けにならず、スループットとエネルギー効率にも悪影響を及ぼすことが観察されました。したがって、著者らは、パフォーマンスやエネルギー効率の向上のために、ULLデバイスに対するIOスケジューラーは不要になったと結論付けています。
論文タイトル: Deep Note: Can Acoustic Interference Damage the Availability of Hard Disk Storage in Underwater Data Centers?
著者と所属: Jennifer Sheldon, Weidong Zhu, Adnan Abdullah, Kevin Butler, Md Jahidul Islam, Sara Rampazzi (Computer and Information Science and Engineering, University of Florida)
概要: この論文では、大規模な海底データセンターに対する音響攻撃の可能性とその影響について調査しています。特に、ハードディスクドライブ(HDD)が音響波によってどの程度影響を受けるか、そしてそれがデータセンターの可用性にどのように影響を与えるかについて詳細に調査しています。
これまでの研究では、音響波がHDDの可用性と整合性に影響を与えることが示されていますが、これらの研究はすべて空気中で行われており、海底環境での適用性と影響はまだ探求されていません。この論文では、海底データセンターや海底ストレージプラットフォームに展開されたストレージデバイスが、標的とした音響攻撃に対してどの程度脆弱であるかを調査しています。
初期の調査結果から、閉じられた海底コンテナに展開された被害者のHDDは、特に音響攻撃に対して脆弱であることが示されています。これらの攻撃は、300Hzから1300Hzの範囲の周波数で行われ、最大で100%のスループット損失とアプリケーションのクラッシュを引き起こすことができます。これらの結果から、海底ストレージシステムのセキュリティを評価し、見落とされがちな音響攻撃に対する効果的な防御策を開発するためのさらなる研究が必要であると主張しています。
論文タイトル: Deep Note: Can Acoustic Interference Damage the Availability of Hard Disk Storage in Underwater Data Centers?
著者と所属: Jennifer Sheldon, Weidong Zhu, Adnan Abdullah, Kevin Butler, Md Jahidul Islam, Sara Rampazzi (Computer and Information Science and Engineering, University of Florida)
概要: この論文は、大規模な海底データセンターに対する音響攻撃の可能性について調査しています。海底データセンターは、冷却コストを削減し、エミッションを節約するために注目を集めています。しかし、これらのデータセンターはハードディスクドライブ(HDD)をデータストレージとして利用しており、音響波がHDDの可用性と完全性に影響を及ぼす可能性があります。
著者たちは、特定の音響攻撃が海底データセンターや海底ストレージプラットフォームに展開されたストレージデバイスの脆弱性を調査しています。初期の調査では、閉じ込められた海底コンテナに配置された被害者のHDDは、特に300Hzから1300Hzの範囲の周波数で音響攻撃に対して脆弱であることが示されています。これらの攻撃は、最大100%のスループット損失とアプリケーションのクラッシュを引き起こす可能性があります。
これらの結果に基づき、著者たちは、海底ストレージシステムのセキュリティを評価し、見落とされがちな音響攻撃に対する効果的な防御策を開発するためのさらなる研究が必要であると主張しています。
論文タイトル: Input and Output Coverage Needed in File System Testing
著者と所属: Yifei Liu, Gautam Ahuja, Geoff Kuenning, Scott A. Smolka, Erez Zadok (Stony Brook University, Harvey Mudd College)
要約: この論文では、ファイルシステムのテストにおける入力と出力のカバレッジの重要性について説明しています。ファイルシステムのテストは、バグを発見し、信頼性を確保するために必要です。多くのファイルシステムテストツールは、そのコードカバレッジに基づいて評価されます。しかし、著者らは、Ext4とBtrFSの最近報告されたバグを分析し、コードカバレッジとテスト効果の間に弱い相関関係があることを発見しました。多くのバグは特定の入力に依存しているため、テストスイートによってカバーされたコードでも見逃されることが多いです。著者らは、システムコールの入力と出力のカバレッジがファイルシステムのテストにおいて非常に重要であると主張しています。そのため、彼らはファイルシステムのテストの基準として入力と出力のカバレッジを提案し、それらがテストの効果をどのように改善できるかを示しています。著者らは、IOCovというプロトタイプを作成し、ファイルシステムのテストツールの入力と出力のカバレッジを評価しました。IOCovは、CrashMonkeyとxfstestsの両方で未テストのケース(特定の入力と出力、またはその範囲)を多数特定しました。また、IOCovを使用して過度なテストと不足なテストを特定する方法と関連指標についても議論しています。
論文タイトル: ファイルシステムテストにおける入力と出力のカバレッジが必要
著者と所属: Yifei Liu, Gautam Ahuja, Geoff Kuenning, Scott A. Smolka, Erez Zadok (Stony Brook University, Harvey Mudd College)
概要: この論文では、ファイルシステムのテストにおける入力と出力のカバレッジの重要性について説明しています。ファイルシステムのテストツールは、コードカバレッジに基づいて評価されることが多いですが、著者らはExt4とBtrFSの最近のバグを分析し、コードカバレッジとテスト効果の間に弱い相関関係があることを発見しました。多くのバグが特定の入力に依存しているため、テストスイートによってコードがカバーされていても見逃されることが多いという結果が得られました。そのため、著者らはシステムコールの入力と出力のカバレッジがファイルシステムのテストにおいて極めて重要であると主張しています。そして、彼らは入力と出力のカバレッジをファイルシステムテストの基準として提案し、それがどのようにテストの効果を向上させることができるかを示しています。また、ファイルシステムテストツールの入力と出力のカバレッジを評価するためのプロトタイプ、IOCovを開発しました。IOCovは、CrashMonkeyとxfstestsの両方で未テストのケース(特定の入力と出力、またはその範囲)を多数特定しました。さらに、IOCovを使用して過剰テストと不足テストを特定する方法と関連指標についても議論しています。
論文タイトル: Cache in Hand: Expander-Driven CXL Prefetcher for Next Generation CXL-SSDs
著者と所属: Miryeong Kwon, Sangwon Lee, Myoungsoo Jung (Computer Architecture and Memory Systems Laboratory, KAIST, Panmnesia, inc.)
要約:
この論文では、次世代のCXL-SSD向けに、ホストCPUからCXL-SSDへの最終レベルキャッシュ(LLC)のプリフェッチをオフロードするExPANDという、エクスパンダ駆動型のCXLプリフェッチャーを紹介しています。ExPANDは、プリフェッチングのための異種予測アルゴリズムを使用し、CXL.memのバックインバリデーションとデータ一貫性を保証します。また、正確なレイテンシ推定のために、プリフェッチのタイムリネスを調査しています。ExPANDは、CXLのマルチ層スイッチングを認識し、各CXL-SSDのエンドツーエンドレイテンシと正確なプリフェッチタイムリネス推定を提供します。この方法は、CXL-SSDへの依存性を減らし、ほとんどのデータに対して直接ホストキャッシュへのアクセスを可能にします。ExPANDは、さまざまなプリフェッチ戦略を持つCXL-SSDプールを超えて、グラフアプリケーションのパフォーマンスを3.5倍向上させます。
論文タイトル: SAND: A Storage Abstraction for Video-based Deep Learning
著者と所属: Uitaek Hong, Hwijoon Lim, Hyunho Yeo, Jinwoo Park, Dongsu Han (KAIST)
概要:
この論文では、ビデオベースの深層学習において、GPUの利用効率を向上させるための新しいシステム、SANDを提案しています。ビデオベースの深層学習では、大量のビデオデータのデコードというデータ前処理が必要となり、これがGPUの計算時間の大部分を占めてしまうという問題があります。また、生のビデオデータをメモリやストレージにキャッシュすることは、データ量が膨大であるためにスケーラブルではありません。
SANDは、深層学習フレームワークがトレーニングデータに直接アクセスできるようにするストレージ抽象化を提供します。この抽象化により、データ前処理の遅延を効果的に隠蔽し、GPUをDNNのトレーニングにフルに活用することが可能となります。SANDは、キャッシュを事前にスケジューリングして管理し、要求されたトレーニングデータが常にキャッシュから即時に取得できるように保証します。このスケジューリングは、キャッシュの置換について深層学習フレームワークの未来のデータアクセスを考慮します。エミュレートされた環境を使用した評価では、SANDはGPUの利用率を6.0倍に向上させ、トレーニング時間を平均で75.9%削減することが示されています。
論文タイトル: P2Cache: An Application-Directed Page Cache for Improving Performance of Data-Intensive Applications
著者と所属:
- Dusol Lee, Seoul National University
- Inhyuk Choi, Seoul National University
- Chanyoung Lee, Seoul National University
- Sungjin Lee, DGIST
- Jihong Kim, Seoul National University
概要: 本論文では、P2Cacheという新しいアプリケーション指向のカーネルレベルページキャッシュを提案しています。P2Cacheは、アプリケーション開発者がターゲットアプリケーションのI/O特性に合わせたカスタムカーネルレベルページキャッシュを構築できるようにするものです。P2Cacheは、Linuxカーネルページキャッシュを拡張し、eBPFプログラムによるアプリケーションプログラム可能なカーネルページキャッシュをサポートするための新しいプローブポイントを追加します。実験結果によれば、P2Cacheを用いて実装されたカスタムページキャッシュは、データ集約型グラフアプリケーションにおいて最大32%のパフォーマンス向上を達成しました。
論文タイトル: Free-Space Adaptive Runtime Zone-Reset Algorithm for Enhanced ZNS Efficiency
著者と所属: Sungjin Byeon1, Joseph Ro1, Safdar Jamil1, Jeong-Uk Kang2, and Youngjae Kim1 1Sogang University,2Samsung Electronics Co.
概要: この論文では、Zone Namespace (ZNS) SSDの効率を向上させるための新しいアルゴリズム、Free-space Adaptive Runtime Zone-Reset (FAR)を提案しています。現行のランタイムゾーンリセットアルゴリズムは、ZNS SSDのパフォーマンスを最適化するために設計されていますが、ZNS SSDの寿命制約を考慮に入れていません。これに対して、FARはZNS SSDの利用可能なフリースペースに基づいてランタイムゾーンリセット呼び出しの頻度を動的に調整します。評価結果から、FARはパフォーマンスを損なうことなく、ZNS SSDの寿命を2倍に改善することが示されています。
論文タイトル: Excessive SSD-Internal Parallelism Considered Harmful
著者と所属:
- Xiangqun Zhang (Syracuse University)
- Shuyi Pei (Samsung Semiconductor)
- Jongmoo Choi (Dankook University)
- Bryan S. Kim (Syracuse University)
要約: この論文では、SSDの内部並列性が過剰になると、ガベージコレクション(GC)のオーバーヘッドが増大し、パフォーマンスに悪影響を及ぼすことを指摘しています。これに対処するために、著者らは新たなSSD並列性管理とデータ配置スキーム、PLANを提案しています。PLANは、異なるワークロードに対して異なるレベルの並列性を割り当てることで、GCのオーバーヘッドを最小化します。評価結果によれば、PLANは他の最先端の設計と比較して、書き込み増幅を減らし、同等またはそれ以上のパフォーマンスを提供することが示されています。
この研究は、SSDのパフォーマンスと効率性を向上させるための新たなアプローチを提供し、SSDの内部並列性がパフォーマンスに与える影響についての理解を深めるものです。
論文タイトル: Energy Implications of IO Interface Design Choices
著者と所属: Sidharth Sundar, William Simpson, Jacob Higdon, Caeden Whitaker, Bryan Harris, Nihat Altiparmak (University of Louisville, Department of Computer Science & Engineering)
概要: この論文では、IOインターフェースの設計選択がシステムのエネルギー消費にどのように影響するかを調査しています。高性能ストレージ技術の利用可能性が増す中で、IOインターフェースの効率性にはさらなるプレッシャーがかかっています。著者たちは、POSIX同期、POSIX非同期、Linux非同期(libaio)IOインターフェース、そして最近注目を集めている高性能非同期設計のspdkとio_uringという2つの新しいインターフェースについて調査しています。これらのインターフェースがシステムのエネルギー消費にどのように影響するかを理解することは、エネルギー意識的な高性能ストレージスタック設計を実現するために重要です。著者たちは、パワーメーター、超低遅延ストレージデバイス、さまざまなワークロード行動を使用して、最もエネルギー効率の良い設計選択を明らかにし、エネルギー意識的な高性能ストレージスタック設計を目指しています。
論文タイトル: 3D QLC NANDフラッシュメモリにおける無効プログラミングの研究
著者と所属: Hongyang Dang, Xiangyu Yao, Zheng Wan, BQiao Li, School of Informatics, Xiamen University
要約: この論文では、3D QLC NANDフラッシュメモリにおける「無効プログラミング」問題について調査しています。3D QLC NANDフラッシュメモリは、その高密度性からストレージシステムに広く応用されています。これらのメモリは、プログラム干渉を避けるために二段階のプログラミング戦略を採用しています。しかし、この戦略は、二つのプログラミングステップの間に非常に長い時間がかかるという問題を引き起こします。その間に、データが更新操作から無効化される可能性があります。二番目のプログラミングステップが無効なデータに対して行われる場合、これを「無効プログラミング」と定義しています。
この研究では、無効プログラミング問題の深刻さを、二つのステップ間の経過時間と無効プログラミングに苦しむページの比率を示すことで調査しています。評価されたストレージシステムのいくつかのパラメータを変化させることで、この問題が3D QLCベースのストレージシステムで一般的であることを示しています。最後に、我々の将来の研究でこの問題に対処するための二つのパイロットソリューションを紹介しています。
論文タイトル: An Efficient Order-Preserving Recovery for F2FS with ZNS SSD
著者と所属: Euidong Lee, Ikjoon Son, Jin-Soo Kim - Seoul National University, South Korea
概要:
この論文では、F2FS(Flash-Friendly File System)とZNS SSD(Zoned Namespace Solid State Drive)を用いた効率的なオーダープリザービングリカバリー(Order-Preserving Recovery)について述べられています。著者らは、データの一貫性を保証しつつ、ファイルシステムのリカバリー中にデータの永続性を効率的に決定するために、ZNS SSDの書き込みポインタを活用する新しい技術、OPRW(Order-Preserving Recovery with Write pointer)を提案しています。このアプローチにより、OPRWはfsync()の一貫性とパフォーマンスを向上させ、リカバリー時間の影響を最小限に抑えます。結果として、リアルなワークロードで最大1.2倍のパフォーマンス向上が達成されています。
この研究は、データの一貫性とパフォーマンスの向上という二つの重要な課題に対処しており、その結果として、ファイルシステムのリカバリーとデータの永続性の効率的な管理について新たな視点を提供しています。
論文タイトル: Hide-and-Seek: Hiding Secrets in Threshold Voltage Distributions of NAND Flash Memory Cells
著者と所属:
- Md Raquibuzzaman, The University of Alabama in Huntsville
- Aleksandar Milenkovic, The University of Alabama in Huntsville
- Biswajit Ray, The University of Alabama in Huntsville
概要: 本論文では、プログラムされたメモリセルのしきい値電圧変動を利用して秘密情報を隠す新しいページ書き込み技術を提案しています。この技術は、一般的なユーザーモードコマンドを利用して、最新の商用3D NANDフラッシュメモリチップ上で実演されています。データ隠蔽のための設計空間メトリクスを探求し、公開データと秘密データのビット精度、秘密データを保持していることの検出可能性を検討しています。提案された方法は、公開データの精度損失がほとんどない状態で、回収された秘密データの精度が97%以上を保証します。分析結果から、提案された技術がしきい値電圧分布にほとんど歪みを導入しないことが示されています。これらの歪みは、プログラム状態の固有のしきい値電圧変動よりも低いです。その結果、提案された方法は、メモリチップへの低レベルアクセスを持つ強力な敵によっても検出できない隠蔽技術を提供します。
論文タイトル: When Caching Systems Meet Emerging Storage Devices: A Case Study
著者と所属: Zhen Lin†∗, Lianjie Cao†, Faraz Ahmed†, Hui Lu∗, Puneet Sharma† (†Hewlett Packard Labs,∗Binghamton University)
要約: この論文では、新たなストレージデバイスがキャッシングシステムにどのように影響を与えるかについて調査しています。特に、ブロックレベルのキャッシングシステムが、ハイブリッドストレージデバイスを利用してI/Oパフォーマンスを向上させる方法について詳しく説明しています。新しいストレージデバイスの登場により、キャッシングシステムは新しいストレージ階層(例えば、永続メモリをキャッシュデバイスとして、SSDをバックエンドデバイスとして使用する)をさらに活用することで、キャッシングパフォーマンスを向上させることが可能になりました。
しかし、新しいストレージデバイスは、既存のブロックベースのキャッシングシステムの設計と実装にも課題をもたらしています。この論文では、人気のあるキャッシングシステムであるOpenCASの包括的なパフォーマンス研究を行い、新たに明らかになったソフトウェアのボトルネックを特定しています。私たちの観察と根本原因分析は、新たなストレージ技術を組み込むためのキャッシングシステムのソフトウェアスタックの最適化に光を当てています。
キャッシングシステムは、ストレージスタックのさまざまなレイヤーで実装され、ストレージシステムのパフォーマンスを向上させるために使用されます。例えば、Linuxオペレーティングシステムは、直接アクセスが遅い大容量のストレージデバイス(例えば、HDD)よりも高速なI/Oを実現するために、DRAMを揮発性キャッシュ(つまり、ページキャッシュ)として使用します。しかし、DRAMは高価で容量が限られています。さらに、高速なソリッドステートドライブ(SSD)が広く利用可能になると、ブロックレベルでのキャッシングが魅力的になります。SSDはHDDよりもはるかに高速で、より高い容量を提供し、DRAMと比較してGBあたりのストレージコストが低いからです。
この論文では、Open CASを例に、Intel Optane PMemをキャッシュデバイスとして、さまざまな種類のSSDをバックエンドデバイスとして使用するという状況での徹底的なパフォーマンス研究を行っています。この研究では、Open CASにおける重要な、以前に検出されていなかったソフトウェアのボトルネックを明らかにしています。
安全・健康に関する標語を考えてみた(ChatGPTが)
- 「健康は富の源、安全は生命の保証」
- 「安全第一、健康最優先」
- 「無理は禁物、安全と健康を大切に」
- 「一瞬の怠慢、永遠の悔い。安全作業を!」
- 「体調不良は休息を、危険作業は回避を」
- 「無事な人生、安全な職場から」
- 「私たちの目標:ゼロ事故、ゼロ病気」
- 「健康のために一歩、安全のために一止」
- 「良い仕事は健康と安全から始まる」
- 「安全な作業、健康な生活」
- 「予防は治療より優れている:安全と健康を優先しよう」
- 「安全な行動、健康な習慣」
- 「危険を見つけたら、すぐに行動!」
- 「あなたの健康と安全は、私たちの成功の鍵」
- 「安全は無事故の第一歩、健康は長生きの秘訣」
- 「毎日、健康と安全のために努力しよう」
- 「安全・健康を心に、安心して仕事を」
- 「安全と健康、それが私たちの使命」
- 「安全でなければ始まらない、健康でなければ続かない」
- 「職場の安全、健康の保持、それが真のプロフェッショナリズム」
- 「在宅でもプロフェッショナル、安全と健康を忘れずに」
- 「小さな設備、大きな責任。安全作業を心掛けよう」
- 「家でも仕事場でも、電気設備は安全に」
- 「小さな設備でも大きな安全意識を」
- 「健康のために適度な休息を、安全のために十分な準備を」
- 「在宅でも安全と健康を第一に」
- 「自宅の作業でも安全第一!」
- 「電気設備は専門的な知識と安全意識が必要」
- 「自宅での作業もプロフェッショナルな対応を」
- 「在宅勤務でも健康管理を怠るな」
- 「家庭の電気設備、安全に使おう」
- 「在宅勤務も安全作業の一部」
- 「小型設備でも危険は大きい、安全に注意を」
- 「在宅でも仕事は仕事、安全と健康を大切に」
- 「小さな電気設備、大きな安全対策」
- 「在宅作業でも、常に安全と健康を考えて」
- 「家でも職場でも、常に安全と健康を優先」
- 「小さな設備でも安全は大切」
- 「在宅勤務でも健康管理、安全確保を」
- 「自宅でもプロフェッショナルな作業を、安全と健康を守りながら」
- 「新しい環境、新たな挑戦、一緒に成長しよう」
- 「不慣れな場所でもプロフェッショナリズムを忘れずに」
- 「未知の環境でも最善を尽くし、安全を確保しよう」
- 「新しい場所でも安全と健康を第一に」
- 「新しい環境、新しい自分を見つけよう」
- 「未知への一歩は、成長への一歩」
- 「新たな環境は新たな学びの機会」
- 「未経験の仕事でも安全に取り組もう」
- 「新環境、新規機会、同じ健康と安全」
- 「新しい環境でも、常に健康と安全を意識しよう」
- 「新しい環境は、新たな挑戦の場」
- 「環境が変わっても、安全への思いは変わらない」
- 「新しい場所での新たな成長」
- 「新環境、新たな視点、一緒に成長しよう」
- 「新しい環境、新しい経験、同じ安全対策」
- 「新しい環境での仕事、安全と健康を維持しよう」
- 「環境が変われば、成長するチャンス」
- 「新しい環境、新たな気持ちで安全作業を」
- 「新環境、新規目標、健康と安全を忘れずに」
- 「新たな環境でも、安全と健康を第一に」
- 「健康は幸福の第一歩」
- 「一日一笑、健康な心を育てよう」
- 「バランスの取れた食事、健康な生活」
- 「休息は仕事の成功へのパートナー」
- 「毎日の運動は健康のための投資」
- 「小さな健康習慣、大きな変化を」
- 「健康第一、それが最強の生産力」
- 「健康な心、健康な体、健康な職場」
- 「あなたの健康は私たちの成功」
- 「健康な生活、幸せな仕事」
- 「ステップバイステップ、健康への道を歩もう」
- 「健康のために、一日一歩」
- 「健康な身体、生産的なマインド」
- 「今日の健康、明日の力」
- 「健康な心と体で、最高の成果を」
- 「毎日、健康のために努力しよう」
- 「健康こそ最大の富」
- 「ストレスレス、健康モア」
- 「君の健康、私たちの幸せ」
- 「健康とハッピネス、一緒に手に入れよう」
いまさらながら HotStrage2022 要約
ChatGPT先生に、HotStrage2022 を要約してもらった。
-
LambdaObjects: Re-aggregating storage and execution for cloud computing
- この発表では、クラウドコンピューティングのためのストレージと実行の再集約について提案しています。LambdaObjectsは、データと関数を一緒に束ねることで、オブジェクト指向プログラミングのクラスに似た概念を提供します。これにより、データ転送のコストを削減し、強い一貫性を実現します。また、プレリミナリな評価結果も示しています。
https://www.hotstorage.org/2022/slides/hotstorage22-paper4-presentation_slides.pdf
"Infusing Pub-Sub Storage with Transactions"という発表では、ストレージシステムに新しい機能を追加するためのフレームワーク、FDMI (Filter Driven Message Interface) を紹介しています。FDMIは、クライアント操作に対してプラグインが購読し、それに応じてストレージシステムの変更を行うことができます。プラグインのアクションはストレージの状態に依存し、トランザクションの結合を通じてプラグインの操作を原子的に実行することができます。
FDMIは3つのプラグインクラスを提供します:
- クラスA:クライアント操作がコミットされた後に通知を受け取り、ソースストレージシステムに何も追加または変更しません。
- クラスB:クライアント操作がコミットされた後に通知を受け取り、プラグインが成功した場合には追加のCORTXトランザクションをコミットすることが保証されます。
- クラスC:ソーストランザクション操作の通知を受け取り、クライアントと協力してトランザクションを更新およびコミットします。
このフレームワークは、プラグインの開発体験を改善し、プラグインを独立してスケーラブルにすることができます。また、幅広いストレージ機能のニーズを満たすためにこれらのプラグインクラスを使用します。ただし、I/Oパスに多くのホップを追加することでオーバーヘッドが生じる可能性があります。この問題は、FDMIソースでクライアントI/Oペイロードをキャッシュすることや、計算をFDMIソースにオフロードすることで最適化することができます。
https://www.hotstorage.org/2022/slides/hotstorage22-paper130-presentation_slides.pdf
F2FS(Flash-Friendly File System)がアドレスリマップと出会ったときの挙動について説明しています。主な内容は以下の通りです:
-
アドレスリマッピングとフラッシュストレージ:フラッシュストレージにおけるアドレスリマップコマンドの使用例が紹介されています。これには、ジャーナリング(冗長な書き込みの削除)やセグメントクリーニング(有効データの移動の削除)などが含まれます。
-
F2FSの欠点:F2FSはランダム更新性能を向上させるためにout-of-placeポリシー(OPU)を使用しますが、これにより無効なブロックが生成され、有効なブロックを回収するためにセグメントクリーニングが必要となります。また、OPUは最新のデータ位置を追跡するための追加のメタデータオーバーヘッドを生成します。
-
F2FSとアドレスリマッピングの組み合わせ:ランダム更新が集中するワークロード下でF2FSが重大なパフォーマンス低下を経験する可能性があります。これを緩和するために、データ書き込み直後にアドレスリマップを実行する新しいアイデアが提案されています。
-
リマップベースのインプレースアップデート(RM-IPU):データブロックを現在のセグメントに書き込み、更新ブロックのリマップコマンドを発行し、セグメントの書き込みを元に戻すという手順が説明されています。
-
パフォーマンス評価:FEMU(QEMUベースのNVMe SSDシミュレータ)を使用した評価セットアップと、FioベンチマークとTPC-Cベンチマーク(MySQL)を使用したワークロードが紹介されています。
-
結論と今後の方向性:RM-IPUは、ランダム書き込み集中ワークロード下でのF2FSの欠点を解決するために、ログ構造方式とアドレスリマップの利点を活用します。今後の方向性としては、他のワークロード、F2FSのアトミックライトとRM-IPU、F2FSの適応的な書き込みモード選択などが挙げられ
-
hotstorage22-paper94-presentation_slides.pdf
- このプレゼンテーションは、データセンターのストレージシステムにおけるデータの配置とアクセスパターンについて説明しています。特に、データの局所性とストレージデバイスの性能による影響に焦点を当てています。また、データ配置戦略の最適化と、データアクセスパターンの予測に基づくストレージシステムのパフォーマンス向上についても議論しています。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper24-presentation_slides.pdf"
このスライドは、Zoned Namespaces (ZNS) SSDの内部並列性を利用するための2つのモジュールを提案しています。ZNSは、論理アドレス空間を複数のゾーンに分割する新しいストレージインターフェースです。各ゾーンは一つ以上のフラッシュブロックにマッピングされ、特定の制約(シーケンシャルライトとイレース(リセット)-ビフォア-ライト)があります。
提案された2つのモジュールは次の通りです:
-
Interference Profiler:このモジュールは、干渉を生成するゾーン間の関係を検出します。具体的には、読み取り要求を送信して帯域幅を測定し、帯域幅が低い場合は干渉が発生していると判断します。これにより、干渉を引き起こすゾーンのセット(Conflict Group)を特定します。
-
Interference-aware I/O Scheduler:このモジュールは、Interference Profilerから得られた情報を利用して、I/O要求の順序を調整し、ゾーン間の干渉のレベルを低減します。具体的には、異なるConflict Groupから来るI/O要求を可能な限りスケジュールします。
評価結果によれば、これらのモジュールを使用すると、帯域幅とレイテンシが大幅に改善することが示されています。具体的には、提案されたスケジューラ(zns_mq)は、平均で1.98倍の帯域幅の改善と、99.9%のタイルレイテンシが平均で11倍短くなることが示されています。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper102-presentation_slides.pdf"
のスライドは、フラッシュメモリにおける読み書きの干渉を軽減するための「Fair I/O Scheduler」について説明しています。
フラッシュメモリでは、同じダイ(チップ内の領域)での書き込み操作が先行すると、読み取り操作が遅延します。これは、フラッシュチップ内の書き込み遅延が読み取りよりも10〜40倍長いためです。特に、Forced Unit Access(FUA)フラグが設定された書き込み要求は、読み書きの干渉を引き起こす可能性が高いとされています。
この問題を解決するために、著者は「TABS(per-Type fAir Bandwidth I/O Scheduler)」という新しいI/Oスケジューラを提案しています。TABSの目標は、各I/Oタイプ(読み取りとFUAフラグ付き書き込み)に対して公平な帯域幅を提供することです。これは、FUAフラグ付きの書き込みのディスパッチ率を制御することで達成されます。
TABSは次の2つのフェーズで動作します:
-
IDLE Phase:このフェーズでは、TABSは現在のワークロードのI/Oパターンを観察します。スケジューリングは無効化され、各I/Oタイプ(読み取りとFUA書き込み)のディスパッチされたI/O要求の数をカウントします。全体のI/Oディスパッチ率が閾値を超えると、フェーズはSCHEDに切り替わります。
-
SCHED Phase:このフェーズでは、TABSはFUAフラグ付きの書き込み要求をFUA遅延キューに挿入します。そして、FUA書き込みを「𝑁𝐹𝑈𝐴,𝑑𝑒𝑞𝑢𝑒𝑢𝑒𝑑」だけディスパッチします。ここで、「𝑁𝐹𝑈𝐴,𝑑𝑒𝑞𝑢𝑒𝑢𝑒𝑑」は「𝑇ℎ𝑟𝑜𝑡𝑡𝑙𝑖𝑛𝑔 𝐹𝑎𝑐𝑡𝑜𝑟 × 𝑁𝑟𝑒𝑎𝑑」で計算され、I/Oパフォーマンスを決定する主要な要素です。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper12-presentation_slides.pdf"
このスライドは、Zoned Namespace SSD(ZNS SSD)上のLSM(Log-Structured Merge-tree)ベースのKey-Valueストアに対する「Compaction-Aware Zone Allocation」(CAZA)という新しいデータ配置アルゴリズムを提案しています。
ZNS SSDは、複数の論理ブロックをゾーンにグループ化し、各ゾーンはZNS SSDの消去ユニットとなります。ZNS SSDはシーケンシャルライトのみを許可し、同じ論理ブロック上の上書きを許可しません。これにより、ガベージコレクションの必要性がなくなりますが、データの配置(ゾーンの割り当て)とフリースペースの再利用(ゾーンのクリーニング)の責任がユーザーアプリケーションに移されます。
LSMベースのKey-Valueストア(LSM-KV)は、シーケンシャルI/Oパターンとアウトオブプレースの更新を持つため、ZNS SSDに適しています。LSM-KVは、データの更新をコンパクションを通じて行います。
ZenFSは、LSM-KVのユーザーレベルのファイルシステムで、RocksDBのバックエンドモジュールとして機能します。ZenFSは、LSM-KV内のデータのゾーン割り当てとフリースペースの再利用のためのゾーンクリーニングを担当します。しかし、ZenFSはどのSSTablesが一緒に削除されるかを正確に予測することができず、ゾーンクリーニング中に有効なデータのコピーを引き起こす可能性があります。
これに対して、提案されたCAZAは、一緒にコンパクションされるSSTablesを同じゾーンに割り当てることで、SSTablesのライフタイムを正確に推定します。評価結果によれば、CAZAは、ZenFSのLifeTimeベースのゾーン割り当て(LIZA)に比べて、書き込み増幅を7.4%低減し、ゾーンクリーニング中のデータコピーを2倍に減らすことができます。
https://www.hotstorage.org/2022/slides/hotstorage22-paper7-presentation_slides.pdf"
このスライドは、Zoned Namespace SSD(ZNS SSD)上のLSM(Log-Structured Merge-tree)ベースのKey-Valueストアに対する「Lifetime-Leveling LSM-tree Compaction」(LL-Compaction)という新しいコンパクションアルゴリズムを提案しています。
ZNS SSDは、論理アドレス空間を固定サイズのゾーンに分割し、各ゾーンはシーケンシャルに書き込まれ、再利用のために明示的にリセットされます。ZNS SSDはSSD側のガベージコレクションを行わないため、ホスト側でガベージコレクションを管理する必要があります。
LSMベースのKey-Valueストアは、シーケンシャルI/Oパターンとアウトオブプレースの更新を持つため、ZNS SSDに適しています。しかし、現在のLevelDBのコンパクションアルゴリズムでは、異なるライフタイムを持つレベル間でスペースの増大(Space Amplification)が発生します。
この問題を解決するために、提案されたLL-Compactionは、コンパクションポインタを保持するためにSSTをCPi+1で分割し、短命なSSTはホールを防ぐためにT-Zoneに書き込まれます。これにより、ZNS SSD上のスペースの増大を軽減し、パフォーマンスを向上させることができま
"https://www.hotstorage.org/2022/slides/hotstorage22-paper10-presentation_slides.pdf"
このスライドは、データ集約型アプリケーションのための「In-Flash Acceleration」、つまり「PiF(Processing-in-Flash)」という新しいストレージアーキテクチャを提案しています。
従来のストレージアーキテクチャでは、大量のデータ移動が必要であり、これがパフォーマンスとエネルギー効率のボトルネックとなっています。これに対し、PiFアーキテクチャでは、データが物理的に存在するフラッシュチップ内に計算を移動することで、データ移動を大幅に削減します。
しかし、PiF技術にはいくつかの課題があります。例えば、フラッシュからアクセラレータへの大量のデータ移動が必要であったり、フラッシュチップの数に対してスケーラブルな加速能力がないといった問題があります。
これらの課題を解決するために、著者たちは「Pattern Matching Enabled PiF Architecture」(パターンマッチングを有効化したPiFアーキテクチャ)を提案しています。このアーキテクチャでは、特定のパターンを検索するための「set_pattern」コマンドと、指定されたパターンを含むページのみを出力する「read_when_matched」コマンドが追加されています。
また、信頼性の高いインフラッシュリードをサポートするために、複雑なECCエンジンを直接実装する代わりに、軽量で低複雑性のECCモジュールを設計しています。さらに、バンド幅劣化を防ぐために、全ての操作をオーバーラップさせるパイプライン構造を採用しています。
評価結果によれば、提案されたPiFベースのSSDは、実行時間と電力効率の両方でPiSベースのSSDを数倍上回る性能を示しています。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper69-presentation_slides.pdf"
このスライドは、細かなI/Oホワイトリストを使用してファイルをランサムウェア攻撃から保護する「Alohomora」という新しいシステムを紹介しています。
ランサムウェアはサイバーセキュリティの大きな脅威となっており、その被害は2021年には200億ドルに達しました。既存の対策は、未知のランサムウェアの挙動や署名を防ぐことができない検出中心の手法、バックアップ操作による過度のI/Oを伴う復元中心の手法、またはランサムウェアが事前に承認された(ホワイトリスト化された)プログラムに注入された場合に防ぐことができない許可中心の手法など、いくつかの制限があります。
これに対して、AlohomoraはI/Oアクティビティに基づいたホワイトリストを提供します。I/Oアクティビティは特定のI/O実行のセマンティックコンテキスト、つまりプログラムの実行パスを表します。Alohomoraでは、書き込まれたページのPrC(Program Context)値を保持し、コンテキストスイッチ時にPrC値を保存・復元します。
また、Alohomoraはホワイトリストを作成するために、事前に承認されたI/OアクティビティのPrC値を事前に知る必要があります。これには静的PrC抽出方法と動的PrC抽出方法の両方が使用されます。
評価結果によれば、Alohomoraは37の公開ランサムウェアプログラム(例えば、GonnaCry、RAASNet、Ransom0、Hidden-tearなど)に対して成功裏に防御しました。また、パフォーマンスオーバーヘッドは平均でわずか3.7%であり、ほとんどI/Oパフォーマンスの低下はありませんでした。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper31-presentation_slides.pdf"
このスライドは、ストレージシステムのパフォーマンスを向上させるための新しいアプローチ、「Pegasus」について説明しています。
Pegasusは、ディスクI/Oの遅延を最小限に抑えるための新しいスケジューリングアルゴリズムを提供します。これは、ディスクI/Oの遅延がストレージシステムのパフォーマンスに大きな影響を与えるためです。
Pegasusの主な特徴は、I/O要求のスケジューリングを行う際に、ディスクの物理的なレイアウトを考慮に入れることです。これにより、ディスクヘッドの移動を最小限に抑え、I/O要求の処理時間を短縮することができます。
Pegasusのアルゴリズムは、ディスクの物理的なレイアウトを考慮に入れるだけでなく、I/O要求の優先順位も考慮に入れます。これにより、重要なI/O要求が優先的に処理され、システムの全体的なパフォーマンスが向上します。
Pegasusの評価結果によれば、既存のI/Oスケジューリングアルゴリズムに比べて、Pegasusは平均で30%のパフォーマンス向上を達成しました。これは、Pegasusがディスクの物理的なレイアウトとI/O要求の優先順位を同時に考慮に入れることで、ディスクI/Oの遅延を大幅に削減した結果です。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper5-presentation_slides.pdf"
このスライドは、次世代ストレージシステムのためのLinuxソフトウェアRAIDシステムを最適化する「ScalaRAID」という新しいアプローチを紹介しています。
RAIDは、スーパーコンピュータ、クラウド、データセンターなど、多くの領域で広く使用されています。しかし、ハードウェアRAIDカードは高速SSDをサポートする能力が限られており、ソフトウェアRAIDが次世代ストレージに適した選択肢となっています。
しかし、現行のLinuxソフトウェアRAID(mdraid)はスケーラブルではなく、CPUスレッド数が増えても帯域幅がスケールせず、またSSD数が増えてもピークスループットがスケールしないという問題があります。これは、mdraidのロックメカニズムが主なボトルネックとなっているためです。
これに対して、ScalaRAIDは、ロックメカニズムを最適化することで、次世代ストレージのためのスケーラブルなパフォーマンスを実現します。具体的には、リソースの異なる範囲を管理するための複数のロックを使用し、スレッドレベルの並列性を最大化します。また、衝突を避けるためのカスタマイズされたデータ構造を提案しています。
評価結果によれば、ScalaRAIDは、帯域幅を89.4%向上させ、99.99パーセンタイルの遅延を85.4%減少させることができました。これは、ScalaRAIDがロックメカニズムを最適化し、スレッドレベルの並列性を最大化した結果です。
"https://www.hotstorage.org/2022/slides/hotstorage22-paper32-presentation_slides.pdf"
このスライドは、ファイルの断片化がI/O制御にどのように影響するか、そしてそれをどのように解決するかについて説明しています。
ファイルの断片化は、ファイルが複数の断片に分散される現象を指します。これはI/Oの数を増やし、I/Oのサイズを減らし、I/Oのランダム性を増加させることで、パフォーマンスを低下させます。
LinuxのI/O制御メカニズム(CFQ、BFQ、IOCost)は、断片化によってそれぞれ異なる問題を引き起こします。CFQでは、断片化により同じデータに対するI/Oの数が増えます。BFQでは、断片化により同じデータに対する時間が増えます。IOCostでは、断片化によりデバイス占有の推定が失敗します。
これらの問題を解決するための一つの解決策として、デフラグメンテーション(断片化の解消)が提案されています。デフラグメンテーションは、CFQではI/Oの数を減らし、BFQでは平均I/Oサイズを増やし、IOCostではI/Oパフォーマンスを安定化させることで、断片化による問題を軽減します。
評価結果によれば、デフラグメンテーションは、CFQ、BFQ、IOCostの各I/O制御メカニズムにおいて、断片化によるパフォーマンスの低下を大幅に改善することができました。