InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
Meta社のオープンソースコード世代 LLM Code Llama
Meta社は最近、コード生成LLMであるCode Llamaをオープンソース化した。これはLlama 2の基礎モデルに基づいており、同じコミュニティ・ライセンスが適用されている。Code Llamaは500Bトークンのコードで微調整され、34Bパラメータまでの3つのモデルサイズが利用可能である。コード生成ベンチマークでの評価では、このモデルは他のすべてのオープンソースモデルを上回り、ChatGPTに匹敵した。
-
ジェネレーティブAIサービス「AWS Bedrock」が一般提供開始
昨年4月にプレビュー版として発表されたBedrockだが、アマゾンはジェネレーティブAIアプリ向けのフルマネージドサービスの一般提供を発表した。
-
Semantic Kernel LLM Java SDKが利用可能になり、GenAIの統合が簡素化
大規模言語モデル(LLM)を一般的なプログラミング言語と統合するSDKであるSemantic Kernelが、Javaで利用可能になった。マイクロソフト社は最近のブログ記事で、Javaライブラリの登場を発表した。マイクロソフト社は今年初め、Semantic Kernelを初めてオープンソース化した。マイクロソフト社はSemantic Kernelを、AI LLMの統合を可能にする軽量SDKと呼んでいる。Semantic KernelSDKはJava以外に、C#とPythonプログラミング言語もサポートしている。
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
SpotifyはSidekickのLLMチャットボットをどのように改善したか?
Large Language Model (大規模言語モデル、LLM)チャットボットにより革新的なソリューションへの扉が開かれる中で、SpotifyのエンジニアであるAtes Goral氏は、ユーザーエクスペリエンスを可能な限り自然なものにするために、レンダリングジャンクを防ぎ、待ち時間を減らすための具体的な取り組みが必要であると主張している。
-
Googleの音声AI AudioPaLMが音声転送で翻訳を行う
Googleの研究者は、音声転送によるテキスト音声変換 (TTS)、自動音声認識(ASR)、音声翻訳(S2ST)を行う大規模言語モデル(LLM)であるAudioPaLMを発表した。AudioPaLMはPaLM-2 LLM をベースにしており、翻訳ベンチマークではOpenAIのWhisperを上回っている。
-
生成AIアプリケーションの安全性を強化するNvidiaのNeMo Guardrails
Nvidiaの大規模言語モデル(LLM)向けの新しいNeMo Guardrailsパッケージは、開発者が有害または攻撃的なコンテンツや機密データへのアクセスなどといったLLMのリスクを防ぐのに役立つ。このイノベーションは、これらモデルの動作を制御するために複数の機能を提供し、より安全なデプロイを保証するものであるため、開発者にとって極めて重要だ。特に、NeMo Guardrailsは、LLMが有害または攻撃的なコンテンツを生成するリスクを軽減することで、AI主導が進む環境において必要不可欠なセキュリティレイヤーを提供する。
-
マイクロソフト、130億パラメータの言語・視覚チャットボット「LLaVA」をオープンソース化
マイクロソフト、ウィスコンシン大学マディソン校、コロンビア大学の研究者は、Large Language and Vision Assistant(LLaVA)をオープンソースで公開した。LLaVAは、CLIP画像エンコーダーとLLaMA言語デコーダーをベースにしており、指示実行データセットでファインチューニングされ、ScienceQAベンチマークで最先端の精度を達成している。
-
Minecraftに初のLLM搭載エージェントが登場
カリフォルニア工科大学、スタンフォード大学、テキサス大学、NVIDIAの研究者は、GPT-4を利用してMinecraftのゲームプレイに参加するLLMパワーエージェント、Voyagerを共同開発しリリースした。Voyagerは、Minecraftで学習し、知識を保持し、卓越した専門性を発揮することで、驚くべき能力を発揮する。
-
Klothoが会話型IaCエディタInfraCopilotをリリース
Klothoは、自然言語処理機能を備えたInfraCopilot(インフラストラクチャー・アズ・コード(IaC)エディタ)を発表した。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。
-
Google、Android開発向けコーディングボット「Studio Bot」をプレビュー公開
Google I/O 2023で、GoogleはAndroid Studio最新版に統合されたAI搭載のコーディングボットStudio Bot(コードネーム:Hedgehog)をプレビュー公開した。Studio Botは開発者がコードとユニットテストを書き、エラー修正をするのを支援することを目的としている。
-
モバイルやノートパソコンでローカル実行可能な大規模言語モデル MLC LLMを公開
MLC LLMは、大規模言語モデルを様々なハードウェアやアプリケーションに展開することを目的とした新しいオープンソースプロジェクトだ。このプロジェクトにはユースケース毎にモデルのパフォーマンスを最適化するためのフレームワークも含まれている。
-
Stability AIが70億パラメータのオープンソースな言語モデル「StableLM」を公開
Stability AIは、大規模言語モデル(LLM)スイートであるStableLMのための訓練済み重みづけモデルを2セット公開した。これらのモデルは、1.5兆個のテキストトークンで学習済で、CC BY-SA-4.0の下で商用利用が許可されている。
-
Hugging FaceがChatGPTに代替版チャットHuggingChatをオープンソースで公開
HuggingChatは、Hugging Faceでテストできる新しいAI搭載のチャットボットだ。記事の下書き、コーディング問題の解決、質問への回答など、ChatGPTが最近多くの関心を集めている多くのタスクを実行できる。