2015年8月18日、日本電気株式会社(以下:NEC、東京都港区、執行役員社長:遠藤信博)は、ビッグデータの予測分析における事前のデータ処理を行う技術として、予測に役立つ特徴的なデータ(以下:特徴量※1)の生成と、その評価を自動化する「特徴量自動設計技術」を開発したことを発表した。
「特徴量自動設計技術」は、NECが開発したビッグデータに混在する多数の規則性を発見する「異種混合学習技術」※2による分析を行う前に、従来、高度なノウハウを持つ分析技術者が行っていた「特徴量」の生成に関する一連のプロセスを自動化するものである。
同技術を用いて実証実験※3を行った結果、事前のデータ処理から「異種混合学習技術」による分析・予測までの全体期間が、従来比約1/3に短縮された。これにより、例えば、大量のデータを分析する必要のある小売店舗の商品別の予測分析を、従来以上に素早く・タイムリーに提供することが可能になる。
NECは、同技術の実用化を2015年度中に予定する。
◆「特徴量自動設計技術」の特徴(図参照)
- データ変換の組み合わせを高速に探索できるアルゴリズムを開発
分析対象となる大量のデータに対して、「データ変換処理」の膨大な組み合わせのなかから、もっとも適切な組み合わせを高速に探索する「高速探索アルゴリズム」を開発。データ分析に有効な「特徴量」を自動的に算出。
- データ分析技術者のノウハウをライブラリ化
特徴量の算出において、「標準化」、「移動平均」(時系列データの平準化)など、データ分析技術者がこれまで多くの経験を通じて培ったさまざまな種類の「データ変換処理」をライブラリ化。本ライブラリを組合わせて、多様な特徴量を簡単に生成可能。
図 新技術の特徴イメージ
※1 特徴量:予測対象に影響を与えると考えられるデータ。
※2 2012年6月22日発表:「NEC、ビッグデータに混在する多数の規則性を自動で発見する技術を開発」
2014年6月18日発表:「NEC、ビッグデータに混在する多数の規則性を自動で発見する「異種混合学習技術」を強化」
※3 3つのビルの電力需要予測を行った実験において、分析技術者が人手で設計した場合に比べ、同等の精度を1/3の期間で実現
■リンク
NEC