【記事】マイクロソフト、データサイエンスツール群「Data Science Utilities」の新バージョンを公開

Ai20170113 02

元記事はこちら。

米マイクロソフトは2017年1月11日(米国時間)、データサイエンスツール集の新バージョン「Data Science Utilities version 0.11」を2016年12月22日に正式リリースしたと告知した。Data Science Utilitiesは、データサイエンスにおけるコラボレーションやチーム学習を改善する同社のアジャイルで反復的な方法論「Team Data Science Process(TDSP)」における主要な要素の1つと同社は位置付けている。

TDSPは2016年9月に初期プレビューを発表、その一部としてData Science Utilities version 0.1も公開された。Data Science Utilities 0.1は、オープンソースの統計解析言語「R」をベースに、以下の2つのツールで構成されていた。

・IDEAR(Interactive Data Exploration, Analysis and Reporting):データサイエンティストがデータセットを対話的に探索、可視化できるように支援するツール

・AMAR(Automated Modeling and Reporting):モデルの訓練、モデルのスイープ、パラメータのスイープを容易にするツール

新バージョンのData Science Utilities 0.11では、「Python 2.7」で動作する「IDEAR in Jupyter Notebook(Python 2.7)」が追加された。

分析やデータサイエンスに使用される言語は、RとPythonが双璧であることから、Pythonにも対応したと同社。IDEAR in Jupyter Notebookは、IDEAR in Rの従来バージョンと同様の機能を利用可能。ユーザーはIDEAR in Jupyter NotebookをJupyter Notebookサーバにアップロードし、Jupyter Notebookのワーキングディレクトリを構成して、データセットの探索を開始できる。また、Pythonのipywidgetsライブラリを使って対話性が実現されている。

Ai20170113 01

これに伴い、既存の「R」ベースのツールはそれぞれ「IDEAR in R」「AMAR in R」に表記を変更。併せて、IDEARとAMARにも、以下の機能追加や機能強化が行われた。

IDEAR in Rで日時フィールドから日時コンポーネントを自動抽出可能に

IDEAR in Rは、日時コンポーネント(年、月、平日、1年のうちの週数、時間など)を自動的に抽出し、元のデータセットに直接追加できるようになった。列名は末尾が「_autogen_year」「_autogen_month」などのようになる。

Ai20170113 02

新機能:IDEAR in Rが「Visual Studio」で「R Tools for Visual Studio(RTVS)」から実行可能に

2016年9月にリリースされたバージョンのIDEAR in Rは、「RStudio」で実行する必要があった。今回、データサイエンスIDEとしてVisual Studio上の「RTVS」を好むユーザー向けに、この環境でIDEAR in Rを実行できるようにした。

機能強化

・「Azure Data Science Virtual Machine(DSVM)」で、IDEARをRとPythonの両方で実行しやすくなった

・IDEAR in Rが、「Hands-On Data Science Sharing R Code – With Style」のガイダンスに従った一貫性の高いコーディングスタイルを備えるようになった

 

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
%d人のブロガーが「いいね」をつけました。