MIT、ドラッグアンドドロップでデータ分析できるツールを発表――機械学習をもっと身近に

Image: Melanie Gonick

SF映画のように、巨大なスクリーンに映し出したデータを指でドラッグアンドドロップするだけで、誰もが直感的にデータ分析できる時代が近づいている。マサチューセッツ工科大学(MIT)とブラウン大学の研究チームは、対話型データサイエンスシステム「Northstar」向けに、最適な機械学習(ML)モデルを即時に生成するツール「仮想データサイエンティスト(VDS)」を発表した。研究結果は、2019年6月30日から7月5日まで開催された「ACM SIGMOD conference」で発表された。

Northstarは、長年MITとブラウン大学が共同で開発している対話型のクラウドプラットフォーム。タッチスクリーン上で直感的に、データの検索・結合・特徴の抽出などができる。操作は、ユーザーがアップロードしたデータ、ラベル、実行したいアルゴリズムなどのツールを、スクリーン上にドラッグアンドドロップしてつなげていくだけと、シンプルで分かりやすい。

研究チームは、Northstarの新しいツールとして、予測タスクを実行するためのMLモデルを即時生成できるVDSを追加した。VDSは「自動化された機械学習(AutoML)」と呼ばれる手法に基づいている。AutoMLを使えば、データサイエンスの知識が不足している人々でもAIモデルをトレーニングできるとして、近年注目されている。

このシステムを利用すれば、医師はある患者が特定の病気を患う可能性、事業主は売り上げを予想できる。対話型ホワイトボードを使って、全員がリアルタイムで一緒に作業することもできる。「例えば、データサイエンスのことを知らないコーヒーショップのオーナーでも、数週間先の売り上げを予測して、仕入れの量を把握できるようになるはずだ」と、研究チームは語る。

VDSを使用すると、データ予測、画像分類、複雑なグラフ構造の分析など、ユーザーのタスクにモデルを合わせ、予測分析を実行することもできる。独自の推定エンジンを使って、自動的に代表的なデータセットをいくつか生成し、順次処理して数秒で近似予測を返す。その後、バックエンドで精査するが、最終結果は概ね最初の予測に近い。処理の速さと正確さだけでなく、「途中経過を確認したり、誤りを見つけたらすぐに直せる点も、ほかのシステムとは異なる」と、研究チームは強調する。

今後は、データの潜在的な偏りや誤りを警告する機能を追加する予定だ。目標は、一部の億万長者やハイテク科学者だけでなく、誰もがデータサイエンスを使って現実世界の問題を解決できるようにすることだとしている。

関連リンク

Drag-and-drop data analytics

関連記事

アーカイブ

fabcross
meitec
next
メルマガ登録
ページ上部へ戻る