InfoQ ホームページニュース Mistral AIがアラビア語と南インドの言語に対応した地域言語モデルのSabaを発表

Mistral AIがアラビア語と南インドの言語に対応した地域言語モデルのSabaを発表

2025年3月27日読了時間 2 分

作者：

Robert Krzaczyński
Software Engineer

翻訳者

kazuki

原文リンク(2025-03-06)

Mistral AIは、アラビア語といくつかのインド言語、特にタミル語のような南インド言語のAIパフォーマンスを向上させるために設計された240億パラメータ言語モデルである、Mistral Sabaを発表した。必要とされる地域的コンテキスト理解を欠く恐れのある汎用モデルとは異なり、Mistral Sabaは中東や南アジアで収集しキュレートされたデータセットで訓練されており、言語文化的により正確な応答を提供している。

アーリーアダプターは、以下のような分野でMistral Sabaをテストしている。

対話型AI：アラビア語でのバーチャルアシスタントやカスタマーサービスのサポート
業界特化型AI：金融、医療、エネルギー分野などでの活用に向けた微調整
コンテンツ生成：地域に関連した教材やビジネス資料の作成

ベンチマーク比較では、アラビア語を使用したタスクにおけるMistral Sabaの高い性能が際立っている。Mistral Sabaは、MMLU、TyDiQAGoldP、AIGhafa、Hellaswagを含む複数のアラビア語を使用したベンチマークにおいて、LLaMA 3.1（70B）やJais（70B）などの大規模モデルを上回っている。特筆すべきは、王冠マークで示されるように、アラビア語を使用したAIGhafaと英語を使用したMMLUで最高精度を記録している点だ。

Benchmark

出典：Mistral AIブログ

今回のリリースにAIコミュニティの注目が集まっている。HEDI社のCEOであるRoxana Rotaru氏は次のように述べている。

これはAIの民主化における転機を示す素晴らしいニュースです。これまではほとんどの言語モデルのトレーニングに英語が主に使用されており、何百万ものユーザーにとって言語文化的な障壁が生じていました。

同様に、マイクロソフトの製品管理・エンジニアリング責任者であるSivaprasad Macha氏は、地域言語を使用したAIの処理能力を向上させることが重要だと述べている。

大規模言語モデルの多くが、地域言語や文化的差異に起因するニュアンスや複雑さを捉えるには不十分でした。南インドの言語は文化遺産の宝庫です。今回のMistral社の発表に期待しています。

本モデルが好評を博しているものの、透明性について疑問の声も生じている。ArsNephというユーザーが次のように質問している。

これは新モデルですか？それとも単にMistral Smallの事前学習を延長しただけのものですか？中東諸国の多くが他に選択肢を持っているにもかかわらず、オープンウェイトモデルでないのですか？Mistral社が発表していた他のリリースはどうなったのでしょうか？

こうした懸念は、ローカル言語を使用したAIソリューションを求める地域で顕著なAIのオープン性とアクセスに関する多岐にわたる議論を映し出している。

本モデルはAPI経由で利用できるほか、ローカルデプロイを用いた組織内インフラストラクチャでの実行が可能である。

作者について

Robert Krzaczyński

Robert Krzaczyński is a software engineer who specialises in Microsoft technologies. Daily, he develops software primarily in .NET, but his interests reach much further. Alongside his core expertise, Robert has a deep interest in machine learning and artificial intelligence, continually expanding his knowledge in these cutting-edge fields. He holds a BSc Eng degree in Control Engineering and Robotics and an MSc Eng degree in Computer Science.

もっと見るより少なく

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

We protect your privacy.

Login with:

アカウントをお持ちでない方

Mistral AIがアラビア語と南インドの言語に対応した地域言語モデルのSabaを発表

作者について

Robert Krzaczyński

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連するコンテンツ

スポンサードコンテンツ

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。