BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース xAI、大規模言語モデル"Grok"を発表

xAI、大規模言語モデル"Grok"を発表

原文リンク(2023-11-14)

イーロン・マスク氏が設立したAI企業xAIはこの頃、大規模言語モデルGrokを発表した。GrokはXプラットフォームを通じて世界の現在の知識にアクセスでき、いくつかのベンチマークでGPT-3.5を含む同規模の他の大規模言語モデル(LLM)を凌駕している。

xAIは今年初めに立ち上げられ、最初のモデルである33BパラメータのGrok-0を訓練した。同社は、最新バージョンであるGrok-1のパラメータや学習の詳細については明らかにしていないが、このモデルは、数学ベンチマークGSM8kやMATH、質問応答ベンチマークMMLU、コーディングベンチマークHumanEvalなど、いくつかのベンチマークでGPT-3.5やLlama 2を上回っているという。このモデルは「ちょっとウィットに富んでいて、反抗的なところがある」と宣伝されており、xAIは他のLLMが答えないような質問にも答えると主張している。xAIチームによれば、

Grokを開発・改良することで、私たちはフィードバックを集め、全人類に最大限の利益をもたらすAIツールを構築することを目指しています。私たちは、あらゆる背景や政治的見解を持つ人々にとって有用なAIツールを設計することが重要だと考えています。また、法律に従いながら、わたしたちのAIツールを使ってユーザーに力を与えたいとも考えています。Grokの目標は、このアプローチを公の場で探求し、実証することです。私たちはGrokが、誰にとっても強力な研究アシスタントとして機能し、関連情報に素早くアクセスし、データを処理し、新しいアイデアを思いつく手助けをすることを望んでいます。私たちのAIツールが持つ究極の目標は、理解の追求を支援することなのです。

"grok"という言葉は、ロバート・ハインラインのSF小説『『異星の客』(原題:"Stranger in a Strange Land")』で使われた造語だが、xAIのモデルは、ダグラス・アダムス氏のSFシリーズに登場する架空のガイドブック『『銀河ヒッチハイク・ガイド(原題:"The Hitchhiker's Guide to the Galaxy")』にインスパイアされているという。xAIによれば、"ほとんどすべてのことに答えることを意図している "という。

Grokに関する技術的な詳細はほとんどないが、JAX、Rust、Kubernetesを使用してトレーニングと推論のためのカスタムMLフレームワークを構築したと述べた。彼らはまた、モデルが2 か月間トレーニングされたことにも言及している。xAI創設メンバーのToby Pohlen氏は、GrokUIをデモするビデオを含むスレッドをXに投稿した。さらに、QdrantオープンソースベクトルデータベースのXアカウントは、Grokのリアルタイムナレッジ機能がQdrant上に構築されていると投稿し、今後のブログ投稿やXエンジニアリングチームとの技術的な会話で詳細を続報するようユーザーに勧めている。

この発表に対する反応は様々だった。Redditでは、あるユーザーがこの試みを賞賛し、このように述べている。

たった2ヶ月のトレーニングでMetaを破るなんて、本当にすごいことだ。彼らは少なくとも10,000台のH100を持っており、GPT-4で使用されたよりも多く演算を行っている。今後もローリング・リリースを続けるようだから、おそらくすぐに改善されるだろう。また、このモデルは打ち切りが少ないようで、他社も同じことをするよう後押ししてくれるだろう。

『Hacker News』のユーザーはより懐疑的であった。あるユーザーは、Grok『Hacker News』のベンチマークスコアはテストセットでのトレーニングによるものではないかと推測している。

最近のLLMの多くは、これらのベンチマークの多くのテストセットを含むインターネット全体のコピーを取っている。もし誰かがChatGPTに勝ったと主張し、そのモデルがテストセットで訓練されたものであれば、当然彼らの方が良い結果を出すだろう。ChatGPTでさえテストセットで訓練されている可能性が高い。

xAIはその可能性は否定できないと述べている。しかしチームは、データセットが収集された後に発表された、ハンガリーの全国高校数学期末試験に対するモデルの試みも手作業で採点している。この試験では、GrokはGPT-3.5とClaude 2の両方を上回った。

他のユーザーからは、Grokには検閲がないと喧伝されているが、これはxAIが偏見やその他のリスクに対する懸念を "払拭 "していることを意味するのではないかと疑問の声が上がった。同社は、AI安全センター所長のダン・ヘンドリクス氏をアドバイザーとして名を連ねている。ヘンドリクス氏はこの頃、Future of Life Instituteのポッドキャストに出演し、AIのリスクについて議論した。ポッドキャストの中で、ヘンドリクス氏はxAIについて次のように述べている。

xAIはかなり真剣な取り組みであることに留意する必要があると思います。おそらく来年か再来年には、主要なAI企業3社のうちの1社になるでしょう―― OpenAI、Google DeepMind、そしてxAI。小規模な取り組みとは考えていません。xAIには実質的な力を見せつける能力が備わっているでしょう。

Grokの早期ベータ版へのアクセスは、認証済みのXユーザーのみが利用できる。

作者について

この記事に星をつける

おすすめ度
スタイル

BT