BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Vercel Fluid:新しいコンピュートモデルでありサーバーレスの代替?

Vercel Fluid:新しいコンピュートモデルでありサーバーレスの代替?

原文リンク(2025-03-09)

Vercelは最近Vercel Fluid、従来サーバー同様にシングルワーカーが複数のリクエストを処理できるようにしながら、サーバーレスの弾力性を保つコンピュートモデルを発表した。インスタンスの前に関数をスケーリングすることでFluidは利用可能な計算時間を最大化し、長時間実行タスクやAI推論のための計算リソース量とリソース効率を最適化する。

開発チームによるとFluidコンピュート搭載の関数は、新しいインスタンスを作成する前に既存のリソースを優先するため、厳しいスケーリング制限がなくなり、ウォームコンピートを活用してより効率的なスケーリングが可能になるという。これにより1つの関数で何万もの同時呼び出しに対応できる多対1モデルへのシフトが可能になる。

Vercel Fluid

出典:Vercel ブログ

Vercelはこの新しいモデルがコールドスタートの防止、効率的な自動スケーリング、水平および垂直の並行処理、最適化されたI/O効率など、いくつかの利点を提供し、これらすべてが従量課金モデルであるとしている。FreshworksのシニアデベロッパーアドボケイトでありAWSサーバーレスヒーローのJones Zachariah Noel N氏は、Fluidコンピュートが次に大成功を収めるものなのか問いかけている

Vercelはコスト効率と実行時のパワーを兼ね備えた最高のサーバーベースのアプローチ、最高の開発者エクスペリエンス(DevX)、サーバーレスのセキュリティを提供しています。Vercelが言うように-サーバーレスの形でのサーバーのパワーであり、さらにコールドスタートの問題に対処し、関数を実行準備完了の状態にしています。

入ってくるリクエストごとに関数を起動する必要性を減らすことで、関数内の同時実行性はアイドル計算時間に対して支払う可能性とコールドスタートに遭遇する可能性の両方を減らす。アイドル計算時間の問題に取り組むことは、ダウンストリームサービスが本質的に(LLMsなど)、またはパフォーマンス問題により遅い応答者であるシナリオにおいて特に重要である。

パフォーマンスとコストを最適化すると主張するこの新しいオプションは、必要な時にのみ計算をトリガーし、ゼロからピークトラフィックへのリアルタイムスケーリングと、新しいリソースをスケーリングする前に既存のリソースを流用することに依存している。Vercel Fluidは高レスポンスタイムだが、CPU使用率のスパイクが低いビデオストリーミングやレスポンス後の処理などのタスク向けに設計されている。VercelのCTO Malte Ubl氏はHacker Newsで、Vercel Fluidと従来のサーバーレスアプローチの主な違いについて説明している:

大きな違いは、マイクロVMの利用方法です。Lambdaはリクエストをエンドツーエンドで処理するためにVM全体を予約します。Fluidは1つのVMを複数の同時リクエストに使うことができます。ほとんどのワークロードはIO待ちでアイドル状態になることが多いため、結果的にこの方法がはるかに効率的になります。

新しい機能をサポートするために、FluidコンピュートはHTTPレスポンスが送信された後のタスクを処理するwaitUntilAPIを導入し、実行時間、同時実行レベル、コールドスタートの発生、全体的なコンピュート利用率などのメトリクスを含む観測可能なダッシュボードを提供する。Vercel's Fluid Compute and what it means for AWS Lambda」でAndreas Casen氏が書いている:

AWSのLambdaがまだ関数内同時実行をまだ解決していないのか、あるいはすでに解決しているが単に「コスト削減をお客さまに還元しない」ことを選択しているのかに関わらず、Fluid コンピュートはコスト効率という点で競争力を提供しており、Lambdaがそれに追いつかないとは想像しにくいです。ボールは今AWS側のコートにあります。彼らはどう応答するでしょうか?

この新しいオプションは人気のあるRedditスレッドで議論されており、あるユーザーが警告している:

フロントエンドをVercelでささやかなSaaSビジネスを運営している者として、価格モデルの変更は最近の疲労の一因となっています。Vercelが収益モデルを改善しようとしているのは理解できるが、エンドユーザーとしては、「Fluidコンピュート」と呼ばれる漠然としたコンセプトで「計算コストを削減する」と約束する別のものが出てくるのは正直迷惑でしかないです。

関数はGB時間単位で課金され、関数に割り当てられたメモリと実行時間により決定される。

作者について

関連するコンテンツ

BT