InfoQ ホームページ Data-Science に関するすべてのコンテンツ
-
インパクトのあるデータ製品戦略を形成する
講演者であり、データ戦略家であり、『Data is Like a Plate of Hummus(データはフムスの皿のようなもの)』の著者でもあるLior Barak(バラック氏)が、Data Engineering Podcastで、戦略計画を推進するためのデータ・ビジョン・ボードの活用について語った。バラック氏は、組織のデータ中心戦略において、データチームはしばしば後になってからコストがかかることになりがちであると主張し、連携、進化、そしてインパクトのある能力の提供を確実にするための3年間の共同ロードマップを提案した。
-
PyTorch カンファレンス 2024:PyTorch 2.4/2.5(開発中)、そしてLlama 3.1
2024年9月18日と19日、Linux Foundationはサンフランシスコのフォート・メイソン周辺でPyTorch Conference 2024を開催した。このカンファレンスでは、PyTorch 2.4とLlama 3.1の最新の機能と、PyTorch 2.5での今後の変更点が紹介された。PyTorch Foundationのエグゼクティブディレクターであり、Linux FoundationのAI担当GMでもあるMatt White氏は、初日のカンファレンスの冒頭で、責任ある生成AIの発展におけるオープンソース・イニシアチブの重要性を強調した。
-
AWSがSageMaker StudioにAmazon Q Developerを導入し、MLワークフローを効率化
AWSは、Amazon SageMaker Studioに新機能としてAmazon Q Developerの追加を発表した。この生成AIアシスタントは、SageMakerのJupyterLabエクスペリエンスにネイティブに組み込まれており、各タスクに最適なツールの推奨、ステップバイステップのガイダンス、コード生成、トラブルシューティング支援を提供する。
-
OpenAIのカスタムGPTが機密情報を漏洩する可能性
OpenAIが新しいGPTストアを展開し始めたことが報告された後、それらが構築されたデータの一部が容易に晒されてしまうことも発見された。複数のグループが、このシステムが機密情報を漏洩する可能性があることを指摘し始めた。
-
Mojoプログラミング言語の紹介
Mojoは、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、新しく発表されたプログラミング言語である。開発の初期段階にあり、その機能を探求するためのオンラインプレイグラウンドをユーザーに提供している。Mojoはデータサイエンスと機械学習における卓越性を目指しており、Pythonに代わる高速な言語を提供する。オープンソース化も徐々に計画されている。
-
Jupyter NotebookにジェネレーティブAI機能を搭載
オープンソースのProject Jupyterは、Jupyter Notebookに強力なジェネレーティブAI機能をもたらす無料ツールJupyter AIをリリースした。
-
AI、ML、データエンジニアリングニュースまとめ:Jupyter AI、AudioCraft、OverflowAI、StableCode、Tabnine
2023年8月7日までの記事で、人工知能、機械学習、データ・サイエンスの分野における重要な成果やリリースが紹介されている。今週の主なニュースは、Jupyter、Meta AI、Stack Overflow、Stability AI、Tabnineに関するものだった。
-
TensorFlow DTensor:分散ディープネットワークトレーニング向けの統合API
最近リリースされたTensorFlow v2.9では、モデル、データ、スペースパラレル(別名、空間タイル)ディープネットワークトレーニングのための新しいAPIが追加された。DTensorの目的は、シャーディング命令をモデルコードから分離することである。そのためにDTensorは、デバイス間でモデルとバッチパラメータを分割するための高レベルのユーティリティを提供する。
-
3世代のtensorプロセッシングユニットから得られた10の教訓
GoogleのTPUグループが発行した最近のレポートでは、3世代のテンソルプロセッシングユニットの開発から得られた10のポイントが挙げられている。著者はまた、彼らの以前の経験が将来のtensorプロセッシングユニットの開発にどのように影響するかについても議論している。
-
継続的な深層学習の評価:画像分類のための新しいベンチマーク
継続的な学習は、ディープネットワークトレーニングの反復全体で知識を保持することを目的としている。��CLEARベンチマーク:実世界の画像に関する継続的な学習」というタイトルの新しいデータセットが最近公開された。この研究の目的は、継続的な学習モデルをより現実的な比較をするために、オブジェクトの自然な時間進化を伴う一貫した画像分類ベンチマークを確立することである。
-
AppleがGCGCをオープンソース化:JavaGCログの分析ツール
AppleはGCGCをオープンソース化した。これは、Python 3とpandasをベースとしたJavaガベージコレクター(GC)ログの視覚化のためのツールである。
-
Julia 1.7でスレッド機能が拡張され、型推論が改善
Julia 1.7では、新しいスレッド機能、新しいパッケージマネージャー機能、型推論の改善、新しい構文機能など、多くの重要な機能強化があった。これは、Apple Siliconでネイティブに実行される最初のリリースでもある。
-
BasisAIのオープンソース、Boxkite機械学習モニタリングツールとは
Boxkiteは、高可用なモデルサーバにおけるコンセプトドリフトを追跡するために設計されたオープンソースのインストルメンテーションライブラリだ。Grafana、Prometheus、fluentd、kubeflowなどのDevOpsツールと統合し、コードやインフラストラクチャを変更することなく、複数のレプリカを作成して水平方向にスケーリングする。プロジェクトは、速く、正しく、シンプルであるべきと主張している。
-
PyodideがWebAssemblyを使ってPythonとその科学スタックをブラウザに提供
Mozillaは、Pyodideが、独立したコミュニティ主導のプロジェクトになったことを発表した。Pyodideは、その全てがブラウザで実行される完全なPythonデータサイエンススタックを提供することを目的としたプロジェクトである。Pyodideは WebAssemblyにコンパイルされたCPython 3.8インタープリターを活用しているため、IodideでPython、NumPy、Pandas、Matplotlib、SciPyなどを使用できる。IodideはWeb用の実験的なインタラクティブな科学計算環境である。
-
AWSがAmazon Finspaceと呼ばれるデータ管理および分析ソリューションを発表
最近、AWSは、Amazon FinSpaceと呼ばれる金融サービス業界(FSI)向けのデータ管理および分析ソリューションを発表した。このサービスは、金融アナリストが分析のためにあらゆる種類の財務データを見つけてアクセスするのにかかる時間を短縮することを目的としている。