InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
マイクロソフト、130億パラメータの言語・視覚チャットボット「LLaVA」をオープンソース化
マイクロソフト、ウィスコンシン大学マディソン校、コロンビア大学の研究者は、Large Language and Vision Assistant(LLaVA)をオープンソースで公開した。LLaVAは、CLIP画像エンコーダーとLLaMA言語デコーダーをベースにしており、指示実行データセットでファインチューニングされ、ScienceQAベンチマークで最先端の精度を達成している。
-
Minecraftに初のLLM搭載エージェントが登場
カリフォルニア工科大学、スタンフォード大学、テキサス大学、NVIDIAの研究者は、GPT-4を利用してMinecraftのゲームプレイに参加するLLMパワーエージェント、Voyagerを共同開発しリリースした。Voyagerは、Minecraftで学習し、知識を保持し、卓越した専門性を発揮することで、驚くべき能力を発揮する。
-
OpenAIのオープンソースChatGPTプラグイン - Roy Miara氏とのQ&A
OpenAIは最近、言語モデルが外部のツールやデータベースにアクセスできるようにするChatGPTのプラグインサポートを発表した。また、知識検索プラグインのコードもオープンソース化され、組織はこれを使用して、独自の文書やデータへのChatGPTベースのアクセスを提供できるようになった。
-
Klothoが会話型IaCエディタInfraCopilotをリリース
Klothoは、自然言語処理機能を備えたInfraCopilot(インフラストラクチャー・アズ・コード(IaC)エディタ)を発表した。
-
AWSがAmazon BedrockとTitan基盤モデルでド派手に生成AIレース参入
AWSはAmazon BedrockとTitanの基盤モデルを発表し、生成AIレースへの参入を発表した。アマゾンは、生成AI技術へのアクセスを民主化し、さまざまな業界やユースケースの顧客に対応することを目的としている。この画期的な開発により、急速に成長するAI市場においてAmazonは手ごわい競争相手になる。
-
OpenAI、GPT-4を用いてGPT-2でニューロンの行動を解釈
OpenAIの研究グループが最近発表した論文では、現在のディープニューラルネットワーク(DNN)の限界の1つである「解釈可能性の欠如」を解決するための新しいアプローチの概要が示されている。研究者たちはGPT-4を用いることで、DNNの解釈可能性を自動化するための第一歩として、どのような事象がニューロンの活性化を引き起こすかを解釈する技術を構築することを目的としている。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。
-
Google、Android開発向けコーディングボット「Studio Bot」をプレビュー公開
Google I/O 2023で、GoogleはAndroid Studio最新版に統合されたAI搭載のコーディングボットStudio Bot(コードネーム:Hedgehog)をプレビュー公開した。Studio Botは開発者がコードとユニットテストを書き、エラー修正をするのを支援することを目的としている。
-
マイクロソフト、マルチモーダルチャットボット「Visual ChatGPT」をオープンソース化
Microsoft Researchは人間が入力したテキストのプロンプトに反応して画像を生成・操作できるチャットボットシステムVisual ChatGPTをオープンソース化した。このシステムはOpenAIのChatGPTと22種類の視覚基盤モデル(VFM)を組み合わせ、マルチモーダルなインタラクションをサポートする。
-
OpenAI、強力で費用対効果が高く、ユーザーフレンドリーなエンベッディングモデルを発表
OpenAIは、テキスト検索、テキスト類似性、コード検索など、これまでの5つのモデルの機能を統合した最先端のエンベッディングモデルであるtext-embedding-ada-002を発表した。この新しいモデルは、従来のもっとも高性能なモデルであるDavinciをほとんどのタスクで上回り、しかも99.8%の大幅なコスト削減を実現している。また、text-embedding-ada-002はより使いやすくなっており、ユーザーにとってより便利な選択肢となっているのだ。
-
モバイルやノートパソコンでローカル実行可能な大規模言語モデル MLC LLMを公開
MLC LLMは、大規模言語モデルを様々なハードウェアやアプリケーションに展開することを目的とした新しいオープンソースプロジェクトだ。このプロジェクトにはユースケース毎にモデルのパフォーマンスを最適化するためのフレームワークも含まれている。
-
Stability AIが70億パラメータのオープンソースな言語モデル「StableLM」を公開
Stability AIは、大規模言語モデル(LLM)スイートであるStableLMのための訓練済み重みづけモデルを2セット公開した。これらのモデルは、1.5兆個のテキストトークンで学習済で、CC BY-SA-4.0の下で商用利用が許可されている。
-
Hugging FaceがChatGPTに代替版チャットHuggingChatをオープンソースで公開
HuggingChatは、Hugging Faceでテストできる新しいAI搭載のチャットボットだ。記事の下書き、コーディング問題の解決、質問への回答など、ChatGPTが最近多くの関心を集めている多くのタスクを実行できる。
-
責任あるAI ~ 原則から実践へ
QCon Londonカンファレンスにおいて、マイクロソフトのプリンシパルプロダクトマネージャーであるMehrnoosh Sameki氏が"責任あるAI ~ 原則から実践へ"と題して講演した。彼女は責任あるAIの6つの主要な原則と、これらの原則を実践するために不可欠な4つの要素について説明し、Fairlearn、InterpretML、責任あるAI Dashboardなどの有用なツールを紹介した。
-
Microsoft Semantic Kernel、従来のプログラムとのLLM統合を実現
マイクロソフトは、 大規模言語モデル(LLM)と従来のプログラムとの統合を可能にするlightweight SDK「Semantic Kernel(SK)」をオープンソース化し、プロンプトのテンプレート化、ベクトル化メモリ、インテリジェント・プランニングなどの機能を活用を可能にした。