InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
Hugging FaceとEntalpicがLeMaterialを発表:AIが材料科学を変える
EntalpicはHugging Faceと共同で、材料科学における重要な課題に取り組むオープンソースイニシアチブ、LeMaterialを立ち上げた。LeMaterialは、主要なリソースからのデータを、670万件のエントリーによる調和のとれたデータセットであるLeMat-Bulkに統合することで、材料探索を合理化し、LED、バッテリー、太陽電池などの分野における技術革新の加速を目的としている。
-
AWSがAmazon Q Developer エージェントに新機能(ドキュメント生成、コードレビュー、ユニットテスト)を追加実装
AWSはこのほど、 AI駆動生成アシスタント「Amazon Q Developer」の機能強化を発表し、ソフトウェア開発プロセスを効率化する新たなエージェント機能を導入した。
-
OpenAIが米国政府機関向けにChatGPT Govを発表
OpenAIはChatGPT Gov、米国政府機関向けに特別に設計されたAI駆動チャットボットのバージョンを発表した。このカスタマイズされたデプロイメントより、連邦、州、地方機関はOpenAIの最新AIモデルにアクセスしながらセキュリティ、プライバシー、コンプライアンスを管理できるようになる。各機関はMicrosoft AzureのコマーシャルクラウドまたはガバメントクラウドでChatGPT Govをセルフホストできるため、厳格な連邦サイバーセキュリティ要件との整合性が確保される。
-
Microsoft Research AI Frontiers LabがAutoGen v0.4ライブラリを発表
Microsoft ResearchのAI Frontiers LabがAutoGen 0.4、先進的なAIエージェントシステムを構築するためのオープンソースフレームワークのバージョン、のリリースを発表した。報告によると最新バージョンはAutoGenライブラリの完全な再設計を特徴としており、コード品質、堅牢性、ユーザビリティ、エージェントワークフローのスケーラビリティの向上に焦点を当てている。このアップデートは、エージェント型人工知能の進展をドライブする強力なエコシステムの確立を目指している。
-
AWS re:Invent 2024のハイライト:Aurora DSQLからAmazon Novaへ
2024年のre:Inventがラスベガスで閉幕した。予想通り、AIは会議の重要な焦点であり、Amazon NovaとSagemakerの新バージョンはもっとも重要なハイライトの一つであった。しかし、コミュニティでもっとも興奮を呼んだ発表は、アクティブ・アクティブな高可用性を備えたサーバーレス分散SQLデータベース、Amazon Aurora DSQLのプレビューだった。
-
主要な大規模言語モデル(LLM)が、隠れた目標を追求する能力を持つことが判明
AI安全性の研究組織Apollo Researchの研究者たちは、AIエージェントが密かに誤った目標を追求し、本当の目的を隠す可能性があることを発見した。この行動はイン・コンテキスト・スキーミングとして知られ、LLMが明示的に欺瞞的な戦略を考慮し、それを実行可能と見なしているため、偶然ではないようだ。
-
DeepSeekが新たなオープンソースAIモデル、Janus Proをリリース
DeepSeekはマルチモーダルモデルJanusのアップデート版、Janus-Proをリリースした。新モデルはトレーニング戦略、データスケーリング、モデルサイズを改善し、マルチモーダル理解とテキストから画像への生成能力を向上させている。
-
Metaがスケーラビリティを向上させたByte Latent Transformer LLMをオープンソース化
Metaはトークナイザーの代わりにバイトのパッチを処理する学習済み動的スキームを使用するLLMアーキテクチャByte Latent Transformer (BLT)をオープンソース化した。これにより、BLTモデルはLlama 3モデルと同等の性能を50%少ない推論FLOPSで実現できる。
-
QCon London 2025 Trainingでマイクロサービス、LLM、チームトポロジーにディープダイブする
19回目を迎えるQCon London 2025は、3日間のテクニカルセッション(4月7日~9日)だけでなく、それ以上のものを提供する。参加者は、シニア開発者、アーキテクト、チームリーダーのための実践的で詳細な学習体験を提供するように設計された2日間のオプショナルトレーニングデイ(4月10日〜11日)を受講できる。これらのセッションは、重要なソフトウェア開発トピックを深く掘り下げ、上級実践者の指導のもとでスキルを磨く絶好の機会だ。
-
DeepSeekがDeepSeek-V3をオープンソース化、671BパラメータのMixture of Experts LLM
DeepSeekは671Bパラメータを含むMixture of Experts (MoE) LLM、DeepSeek-V3をオープンソース化した。2.788M GPU時間を使って14.8Tトークンで事前学習され、MMLU、MMLU-Pro、GPQAを含む様々なLLMベンチマークで他のオープンソースモデルを上回る性能を示している。
-
Google、実験的なAI推論モデルをリリース
GoogleはAI Studioプラットフォームで利用可能なAI推論モデル Gemini 2.0 Flash Thinking Experimentalを発表した。この実験的なモデルは、複雑な問題を推論することでプログラミング、数学、物理学などのマルチモーダルタスクを処理するために設計されており、その思考過程を説明することができる。これはGemini 2.0 Flashモデルを基に構築されており、OpenAIのo1を含む類似モデルと整合している。
-
HuatuoGPT-o1: AIによる複雑な医療推論の進展
香港中文大学深圳校と深圳ビッグデータ研究所の研究者は、複雑な医療シナリオにおける推論を改善するために設計された医療用大規模言語モデル(LLM) HuatuoGPT-o1を発表した。このモデルは新しい2段階の訓練プロセスを使用して開発され、医療専門家が使用する診断アプローチに似た段階的な分析を通じて応答をリファインすることを目指している。
-
EuroLLM-9Bは、欧州言語のための最先端のLLMサポート向上を目指している
EuroLLM-9Bはヨーロッパで構築されたオープンソースの大規模言語モデルで、EUの全公用言と11の非公用語(商業的に重要ではあるが)を含むヨーロッパ言語向けに調整されている。開��チームによると、その性能は、このサイズのヨーロッパ製LLMの中で最高のものだという。
-
Google、Gemini Code Assistがサポート範囲をAtlassian、GitHub、GitLabに拡大
Googleは最近、Atlassian Rovo、GitHub、GitLab、Google Docs、Sentry、Snykを含むGemini Code Assistのサードパーティツールのサポート を発表した。プライベートプレビューにより開発者は広く使用されているソフトウェアツールとパーソナルAIアシスタントの統合を直接IDE内でテストできる。
-
NVIDIAがHymba 1.5Bを発表: 効率的NLPモデルへのハイブリッドアプローチ
NVIDIAの研究者は、トランスフォーマーと状態空間モデル(SSM)アーキテクチャを組み合わせて前例のない効率とパフォーマンスを実現するオープンソース言語モデル、Hymba 1.5Bを発表した。NVIDIAの最適化されたトレーニングパイプラインで設計されたHymbaは、従来のトランスフォーマーの計算およびメモリの制約に対処しつつ、SSMの記憶能力を向上させている。