2023年8月7日までの記事で、人工知能、機械学習、データ・サイエンスの分野における重要な成果やリリースが紹介されている。今週の主なニュースは、Jupyter、Meta AI、Stack Overflow、Stability AI、Tabnineに関するものだった。
JupyterLab用のジェネレーティブAI拡張機能をJupyter Notebookに搭載
Jupyter NotebookにジェネレーティブAIを追加するプロジェクトJupyter AIを発表した。簡単な自然言語のプロンプトから完全なノートブックを生成し、コードの説明や記述、エラーの修正、内容の要約を可能にする。このプログラムはJupyterAI21を、Anthropic、AWS、Cohere、LangChainがサポートするOpenAIなど複数のベンダーの大規模言語モデル(LLM)にリンクする。
Jupyter AIは、倫理的なAIとデータ保護を念頭に作成されているため、ユーザーは個々のニーズに合わせて好みのLLM、エンベッディングモデル、ベクトルデータベースを自由に選択できる。データの透明性は、ソフトウェアのコアとなるプロンプト、チェーン、コンポーネントのオープンソースによって保証されている。さらに、モデルが生成したコンテンツに関するメタデータが保存されるため、ワークフロー全体を通してAIが生成したコードを簡単に追うことが可能だ。重要なことは、Jupyter AIはユーザーデータのプライバシーを保護し、要求があった場合にのみLLMと通信することである。
Meta、音と音楽を生成するフレームワークAudiocraftをオープンソース化
Metaは、テキストから音楽を生成するジェネレーティブAIであるAudioCraftを研究者や技術者が独自モデルを作成し、より高度化できるようオープンソース化をした。AudioCraftは、短いテキスト記述(プロンプト)から高品質でリアルな音声と音楽を生成するフレームワークである。AudioCraftは主に3つの異なるAIモデルに基づいている:MusicGen、AudioGen、EnCodecだ。Metaが所有しライセンス供与されている音楽サンプルを使って、MusicGenはテキストベースの入力から音楽を作成する。AudioGenは、一般にアクセス可能なサウンドエフェクトを使用し、テキストベースの入力からオーディオを作成する。EnCodecデコーダーにより、忠実なオーディオ出力が生成され、中間生成物の少ないより高品質な音楽生成が可能になる。
AudioCraftは、圧縮、生成、音楽/サウンド作成のプロセスを簡素化する。ユーザーは現在のコード基盤を拡張して、より効率的なサウンド生成や圧縮方法を実現でき、これはAudioCraftの適応性の高さを示すものだ。要するに、新たに始めるのではなく、確立されたフレームワークの上に構築することになる。よって出発点は、データセットの持つ制限によって決定される。
Stack OverflowがOverflowAIでジェネレーティブAIに飛び込む
Stack Overflowは、その公開プラットフォームであるStack Overflow for TeamsにジェネレーティブAIを組み込む計画を発表した。この革新的なアプローチは、コミュニティが生成した5,800万件の質問と回答から得られた広範な専門知識をカプセル化し、開発者が集中力を高めてタスクを達成する空間にシームレスに統合するように設計されたIDEを含む、新しい製品領域にまで及んでいる。この包括的な取り組みはOverflowAIと総称される。
このOverflowAIは、公共および企業プラットフォームの両方におけるAI検索の改善を含む、多くのプロジェクトで構成されている。OverflowAIは単一の製品ではなく、企業向けにSlackとの統合やOverflowAIのVisual Studioコードプラグインも用意されている。さらに、OverflowAIはStack Overflow for Teamsによる企業単位での知識収集を支援する。最終的な目的は、企業と開発者が必要な情報を見つけ、活用することをより簡単にすることだ。
Stability AIがコード生成のためのLLM、StableCodeを発表
Stability AIは、同社初のLLMジェネレーティブAI製品であるStableCodeを発表した。この製品は、プログラマーの日常業務を支援すると同時に、スキルを次のレベルに引き上げる準備ができている新人開発者に優れた学習ツールを提供するように設計されている。StableCodeには、一般的なユースケース向けのベースモデル、命令モデル、最大16,000トークンをサポートするロング・コンテキスト・ウィンドウ・モデルの3つの階層が用意されている。
StableCodeモデルは、オープンソースのBigCodeプロジェクトから入手したプログラミング言語データの初期コンパイルを利用しており、Stability AIによってさらに洗練され、微調整されている。初期段階では、StableCodeはPython、Go、Java、JavaScript、C、markdown、C++などの言語を含むプログラミングの試みをサポートしている。
TabnineがTabnine Chatを発表
Tabnineは最近、自然言語を使ってTabnineのAIモデルと対話するTabnine Chatのベータ版を発表した。このチャット・アプリケーションはIDE内で動作し、組織は許可されたコードのみでトレーニングでき、隔離された環境でのデプロイで実行できる。
Tabnine Chatは、開発者がTabnineのAIモデルと自然に対話できるエンタープライズグレードのコーディングチャットアプリケーションである。ChatGPTとは異なり、大規模なプロジェクトでプロの開発者を支援することに重点を置いている。IDE内で動作し、特に大規模な商用プロジェクトにおいて、最初のアプリ作成と継続的な作業の両方をサポートする。Tabnine Enterpriseユーザーは、リポジトリに接続することで、社内のプロジェクトに特化した支援を受けることが可能だ。このツールはセキュリティのニーズに対応し、隔離されたデプロイオプションを提供してコードのプライバシーを確保する。Tabnine Chatのトレーニングでは、コピーレフトのコードによる汚染を防ぐため、寛容なライセンスのオープンソースコードのみを使用するのである。