InfoQ ホームページニュース LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

2024年11月26日読了時間 3 分

作者：

Olimpiu Pop
Tech Executive and Engineer Focused on a Holistic Approach

翻訳者

Naoko Koshimura

原文リンク(2024-10-23)

InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。

彼女はまず、APIの背後に隠されたブラックボックスモデルを使用することは、良いソフトウェアの特性である、モジュール性、透明性、説明可能性、データプライバシー、信頼性、手頃な価格を満たすことを妨げると述べた。

さらにMontani氏は、GenAIが、顧客が製品についてフォーラムに残したコメントを評価するような、人間の言語を解釈する必要がある（「多くの場合、言語は曖昧である」）様々な状況で役立つと指摘した。彼女は、基礎となるモデルの全能力は必要とするわけではなく（「それで天気について話したくはないでしょう」）、文脈を理解するだけでいいと強調した。これは、タスクに特化した情報を抽出するために転移学習を使うことで実現できる。

Alt text

「プロトタイプの停滞期」を通過し、システムを「プロダクション・レディ」にするためには、Montani氏によれば、以下のアクションが必要だという。

インプットとアウトプットを標準化する-プロトタイプと目標とする生産システムは同じデータ型を持つ必要があります。
評価から始める-これはソフトウェア開発におけるテストに相当する。答えを知っている回答を求める。こうすることで、精度のスコアに基づいて、システムが改善されているかどうかがわかる。
正確さだけでなく、有用性を評価する-正確さのスコア以外に、モデルの有用性（「あなたがやっていることに有用か」）をチェックする必要がある。
反復的にデータに取り組む-コーディングの実践と同様に、最適なものが見つかるまで、さまざまなアプローチやツールを試すべきである。
自然言語の構造と曖昧さを考慮する-人間の言語からの抽出物は、標準的なデータのようには扱えない（「きれいに並べられた箱には収まらない」）。

自然言語処理（NLP）を含むプロトタイプに取り組む場合、良い出発点は、出力を解析し、構造化されたデータを含むオブジェクトを提供するツールによって提供できる大規模な言語モデル（LLM）である（「それがspaCyLLMを構築した理由だ」）。そして、たとえ本番でそのようにデプロイできたとしても、より良いアプローチは、実行時にLLMを、必要な部分だけを実行するタスクに特化したコンポーネントで置き換えることだろう。そうすれば、システムはよりモジュール化され、透過的になり、（おそらく）より速くなる。

さらに、「人間をループに入れる」ことで、LLMの間違いを修正し、LLMのアウトプットの質を上回ることができる。ベースライン（既成概念にとらわれない結果）を定義した後、プロンプトを修正し、アノテーションツールを通して、対象とするタスクに非常に特化したデータセットを作成する。効率的に「人間にアクセス」するためには、データを何度も通過させ、その都度1つの側面だけに焦点を当てる。こうすることで、認知的負荷が下がり、速度が向上する。

Montani氏: 開発者として、私たちはプロトタイプの停滞期にはまらないで物事を出荷する必要があります。問題をより扱いやすくすることは許されます。これは競争ではないです。ここは学問の世界ではないし、複雑さが少ないということは、問題が発生する可能性も少なくなるということです。

蒸留のプロセスは、コードのリファクタリングと考えることができる。問題をより小さなものに分解し、複雑さを減らし、ビジネスロジックの仕様をシステムの特殊性から切り離すといったテクニックを使うことができる。このフェーズでは、依存関係や使用されているテクニックを再評価し、タスクにもっとも適したものが使用されていることを確認できる。

Alt text

自然言語処理に基づくアプリケーションで使用されるモデルを蒸留することの多面的な利点を強調するために、Montani氏は、explosion.aiが複数の分野の顧客を支援したケーススタディの要約を提供した。指摘されたように、最終的なモデルは通常、LLMによって提供された最初のベースラインよりも小さく、より正確だった。したがって、モデルの反復に時間をかけることは、長期的にははるかに良い結果をもたらし、運用コストも削減できる。

作者について

Olimpiu Pop

Tech Executive and Engineer Focused on a Holistic Approach and using technology to provide solutions to real problems with minimal impact on the environment. He has experience in developing real-time applications ranging from financial software to IAM. Passionate about tooling and optimising development flows with or without AI. Led and shaped technical organisations of hundreds of developers (from support engineers to Architects). Tech community builder: Transylvania JUG facilitator, member of the program committee for Voxxed Romania and Devoxx UK, conference speaker and podcaster on cybersecurity and open-source topics for 505updates.com. Main editor and troublemaker of JavaAdventCalendar.

もっと見るより少なく

特集コンテンツ一覧

All
アーティクル
プレゼンテーション
インタビュー
Eブック
ポッドキャスト
審査

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

We protect your privacy.

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

作者について

Olimpiu Pop

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

デベロップメント

設計/アーキテクチャ

AIと機械学習、データエンジニアリング

大規模言語モデル

Artificial Intelligence

Architecture

特集コンテンツ一覧

Kafka 4.0: KRaftがアーキテクチャを簡素化

Uberがプロファイルガイド最適化でパフォーマンス向上

VS Code Copilot用GPT-4oコード補完モデルがパブリックプレビューで利用可能に

AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進

Dapr Agents：LLM、Kubernetes、マルチエージェント協調によるスケーラブルなAIワークフロー

ほとんどの企業が毎週障害を経験：The State of Resilience 2025 Report

ソフトウェア業界でレジリエンスを高める業界・企業文化や習慣を育むには

DevOpsの原則とプラクティスを品質保証エンジニアとして適用する

ソフトウェアの無駄削減で、開発者は気候変動への負荷を軽減できるのか？

Anthropicの「AI顕微鏡」が大規模言語モデルの内部構造を探る

InfluxDB 3のオープンソース版が一般提供（GA）に到達

FastAPI-MCP: FastAPIとAIエージェントの統合をシンプルに

Google Goモジュールミラーが3年以上にわたってバックドアを提供していた

Meta社がうるう秒を処理するためにPrecision Time Protocolを使用する方法

オブザーバビリティがLLMベースのシステムのユーザーエクスペリエンスを向上させる方法：KubeCon EUでのHoneycombのCEOの洞察

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

QCon AI New York

Login with:

アカウントをお持ちでない方

LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

作者について

Olimpiu Pop

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。