最新のAWS Storage Dayイベントにおいて、AmazonはMountpoint for Amazon S3の一般提供を発表した。この新しいオープンソースのファイル・クライアントは、ファイル・インターフェイスを通じてAmazon S3の拡張性のあるストレージとスループットを提供し、各EC2インスタンスとオブジェクト・ストレージ間で最大100Gb/秒のデータ転送をサポートしている。
Mountpoint for Amazon S3は、今年初めにプレビュー版として発表され、シーケンシャルライト、シーケンシャルリード、ランダムリードを行い、完全なPOSIXセマンティクスを必要としないデータレイクアプリケーションのようなワークロード向けに設計されている。AWSの 副社長兼チーフ・エバンジェリストであるjeff barr氏は、次のように語っている。
多くのAWS顧客は、S3 APIとAWS SDKを使用して、S3バケットのコンテンツをリスト、アクセス、処理できるアプリケーションを構築している。しかし、多くの顧客は既存のアプリケーション、コマンド、ツール、ワークフローを持っており、ディレクトリの読み取り、既存のファイルを開いて読み取り、新しいファイルの作成と書き込みなど、UNIXスタイルでファイルにアクセスする方法を知っている。これらの顧客は、大規模なS3へのパフォーマントなアクセスをサポートできる、エンタープライズ対応の公式クライアントを求めている。
新しいオープンソース・クライアントのその他の一般的な使用例として、機械学習トレーニング、画像レンダリング、自動運転車シミュレーション、ETLなどがある。Mountpointは、各EC2インスタンスとS3バケット間で最大100Gb/秒のデータ転送をサポートし、ローカルファイルシステムAPI呼び出しをS3オブジェクトAPI呼び出しに変換し、マネージドネットワークファイルシステム(NFS)と比較してコストを削減している。とbarr氏は補足する。
Linuxの仮想ファイルシステム(VFS)は、操作をMountpointへの呼び出しに変換して、MountpointはS3への呼び出し(LIST、GET、PUT など)に変換する。 Mountpointは、ネットワーク帯域幅を有効活用するよう努め、スループットを向上させて、より多くの作業をより短時間で完了することで計算コストの削減を可能にしている。
人気のRedditスレッドでは、さまざまなユーザーが、この新製品が既存のオープンソースのs3fsや商用ObjectiveFS製品と比較してどうなのかを質問している。Human Madeのシニア・クラウド・エンジニア、Fernando Schubert氏のコメントは以下である。
これが正式にサポートされるようになったのは興味深いことだが、s3fs/fuseは以前から、機能比較とベンチマークを熱望していた。
AWSのシニア・ソリューション・アーキテクトであるJukka Forsgren氏は、AWSクライアントの目標の1つを[取り上げている]](https://www.linkedin.com/feed/update/urn:li:activity:7095364500253548544?utm_source=share&utm_medium=member_desktop)。
以前の会社では、私は多くの顧客のAWS環境に対して、24時間365日のオンコール当番をしていた。よくある問題の一つとして、EC2 Linuxインスタンス上のS3マウントのスタックに関するものであり、夜中に修正しなければならないことが多発していた。これを踏まえて、我々はAmazon S3用のMountpointと呼ばれる独自のクライアントに対して、安定性を主要な設計目標の1つとしてー般提供したことに気づけたのは素晴らしかった。
Mountpointは汎用のネットワークファイルシステムではないため、ファイル操作にはいくつかの制限がある。AWS Common Runtime (CRT)ライブラリ上に構築された、Rustベースのクライアントは、5TBまでのサイズのファイルを読み込むこめ、既存のファイルを変更したり、ディレクトリを削除はできず、シンボリックリンクやファイルロックはサポートしていない。
現在、すべてのS3ストレージクラスがサポートされているわけではなく、 MountpointはアーカイブクラスのGlacier Flexible Retrieval、Glacier Deep Archive、Intelligent-Tiering Archive Access Tier、Intelligent-Tiering Deep Archive Access Tierでは動作しない。
Mountpointの利用に特別な料金はかからず、開発者は基礎となるS3操作の料金を支払う。MountpointはRPM形式で入手可能で、ロードマップはGitHubで公開されている。