Mistral AIは、アラビア語といくつかのインド言語、特にタミル語のような南インド言語のAIパフォーマンスを向上させるために設計された240億パラメータ言語モデルである、Mistral Sabaを発表した。必要とされる地域的コンテキスト理解を欠く恐れのある汎用モデルとは異なり、Mistral Sabaは中東や南アジアで収集しキュレートされたデータセットで訓練されており、言語文化的により正確な応答を提供している。
アーリーアダプターは、以下のような分野でMistral Sabaをテストしている。
- 対話型AI:アラビア語でのバーチャルアシスタントやカスタマーサービスのサポート
- 業界特化型AI:金融、医療、エネルギー分野などでの活用に向けた微調整
- コンテンツ生成:地域に関連した教材やビジネス資料の作成
ベンチマーク比較では、アラビア語を使用したタスクにおけるMistral Sabaの高い性能が際立っている。Mistral Sabaは、MMLU、TyDiQAGoldP、AIGhafa、Hellaswagを含む複数のアラビア語を使用したベンチマークにおいて、LLaMA 3.1(70B)やJais(70B)などの大規模モデルを上回っている。特筆すべきは、王冠マークで示されるように、アラビア語を使用したAIGhafaと英語を使用したMMLUで最高精度を記録している点だ。
出典:Mistral AIブログ
今回のリリースにAIコミュニティの注目が集まっている。HEDI社のCEOであるRoxana Rotaru氏は次のように述べている。
これはAIの民主化における転機を示す素晴らしいニュースです。これまではほとんどの言語モデルのトレーニングに英語が主に使用されており、何百万ものユーザーにとって言語文化的な障壁が生じていました。
同様に、マイクロソフトの製品管理・エンジニアリング責任者であるSivaprasad Macha氏は、地域言語を使用したAIの処理能力を向上させることが重要だと述べている。
大規模言語モデルの多くが、地域言語や文化的差異に起因するニュアンスや複雑さを捉えるには不十分でした。南インドの言語は文化遺産の宝庫です。 今回のMistral社の発表に期待しています。
本モデルが好評を博しているものの、透明性について疑問の声も生じている。ArsNephというユーザーが次のように質問している。
これは新モデルですか?それとも単にMistral Smallの事前学習を延長しただけのものですか?中東諸国の多くが他に選択肢を持っているにもかかわらず、オープンウェイトモデルでないのですか?Mistral社が発表していた他のリリースはどうなったのでしょうか?
こうした懸念は、ローカル言語を使用したAIソリューションを求める地域で顕著なAIのオープン性とアクセスに関する多岐にわたる議論を映し出している。
本モデルはAPI経由で利用できるほか、ローカルデプロイを用いた組織内インフラストラクチャでの実行が可能である。