Greenplum が MapReduce をサポートとのこと

Greenplum MapReduce - Bringing Next-Generation Analytics Technology to the Enterprise
Greenplum MapReduce enables programmers to run analytics against petabyte-scale datasets stored in and outside of the Greenplum Database.

Greenplum MapReduce は、Greenplum DB の中または外にある、ペタバイトスケールのデータに対する、分析を可能にする。

http://www.greenplum.com/resources/mapreduce/

ホワイトペーパーをパラっとみたところ、以下の 2 点が目にとまった。

  • map フェーズは、Greenplum の各ノード(データベースエンジン)の上で実行されるため、パラレルI/O の恩恵を受けることが出来る
  • PerlPython で map / reduce の処理を書くことが出来る

サンプルコードも性能数値もまだ出ていないのでちょっと具体的に掴めないかんじ。ま、まだアーリーアクセスらしいしそんなもんか。
Greenplum は、穏やかなトランザクションで、データサイズが大きいという領域ではあるが、トランザクションまで含めた RDBMS ということで気になる存在だ。