日本IBM(社長:マーティン・イェッター)は、IBMのビッグデータ処理に特化した統合プラットフォーム「IBM(R)PureData System」へのラインアップの追加および拡張を発表します。テキストや画像などの非構造データを大量かつ効率的に扱うHadoop基盤を提供する 「IBM PureData System for Hadoop H1001」、ならびにNetezzaテクノロジーを実装したハイ・パフォーマンス・ アナリティクス基盤のエントリー・モデル「IBM PureData System for Analytics N2002-002」の提供を新たに開 始します。いずれの製品も本日よりIBMおよびIBMパートナー経由で販売を開始し、「IBM PureData System for Hadoop H1001」は本日より、「IBM PureData System for Analytics N2002-002」は10月18日より出荷を開始し ます。
なかでも、ビッグデータの処理に特化して最適化された垂直統合型システムである「IBM PureData System」のラインアップにおいては、高 速データ入出力処理(データベース)向けの「IBM PureData System for Transactions」、大容量データの高速分析処理 (データウェアハウス)向けの「IBM PureData System for Analytics」、次々に取引される業務処理データを蓄積データと 照合するといった即時的な分析処理向けの「IBM PureData System for Operational Analytics」を展開してい ます。
本日新たに「IBM PureData System」ラインアップに追加される「IBM PureData System for Hadoop」は、テキストや画像など蓄積された大容量の非構造化データの並列分散処理や解析を実行するHadoop環境の構築・運用に特化した 統合型システムです。Hadoop環境の構築に必要なハードウェア、ストレージ、ソフトウェアを統合して最適化した状態で出荷されるため、システム稼働ま での手間と時間を大幅に短縮することができます。
「IBM PureData System for Hadoop」は、IBMの Hadoop基盤ソフトウェア「IBM InfoSphere BigInsights」を採用しており、ANSI(*1)に準拠したSQLで Hadoop上のデータを扱えるBigSQL、プログラミングなしにデータを可視化し編集できるスプレッドシート形式のBigSheets、ハードウェア も含めてWebブラウザ経由で監視と管理ができる統合管理ツールなどを備えており、Hadoopを用いたビッグデータの容易な活用を実現するとともに、シ ステムの運用にかかるコストの最適化にも貢献します。さらに、IBMのデータウェアハウス・システムとの連携ソリューション「IBM InfoSphere Optim EasyArchive for PureData Hadoop」によって、「IBM PureData System for Analytics」上のデータをインポート/エクスポートすることが可能となり、システムの拡張性や冗長性を高めます。
本日より販売を開始する「IBM PureData System for Hadoop H1001」は、Hadoop環境を迅速かつ確実に構築したい お客様に最適な、エンタープライズ向けの統合型システムです。IBMのx86サーバー・テクノロジーをベースに、18台のデータノードと冗長化された2台 のマスターノード、10ギガビットと40ギガビットのイーサネットを最適に組み合わせたネットワークから構成されています。データノードの内蔵ディスクは HDFS(Hadoop Distributed File System;Hadoop分散ファイルシステム)でフォーマットされており、また、データ は圧縮して格納されるため、およそ1ペタバイトを格納することが可能です(*2)。また、数日で初期設定を完了できるよう統合された状態で出荷されるた め、迅速かつ容易にHadoop環境の活用を開始することができます。
また本日、Netezzaテクノロジーを採用した、高速でのビッ グデータ分析に特化した統合型システム「IBM PureData System for Analytics」に、エントリー・モデルとなる「IBM PureData System for Analytics N2002-002」を新たに追加します。これは、2013年2月より提供を開始してい る、ハイパフォーマンス・モデルの小規模構成版として位置づけられます。Netezzaテクノロジーの特長である超並列処理のシステム設計はそのままに、 データ処理を行うブレードやディスクの本数を抑えることで、エントリー・クラスに求められる性能と価格を実現しています。ビッグデータの高度な活用への需 要がますます広がっていくなかで、中堅中小企業や部門単位、拠点単位での導入など、幅広いニーズにこたえる製品です。