2012年11月9日、アマゾンデータサービスジャパン目黒オフィスでAWS ビッグデータ活用事例セミナーが開催されました。
セミナーの要点をレポートします。
AWSの代表的ビッグデータサービスである、Hadoop管理サービスElasticMapReduce(EMR)、EMR上で稼働するHBASE、NoSQL型サービスDynamoDBなどについて活用事例を含めてご紹介します。
また、AWSを使ったCasandraやMongoDBと言ったビッグデータを扱うための人気のNoSQL系DBのインプリメンテーション事例についても詳細をご説明します。
Amazon Elastic MapReduce(Amazon EMR)の概要
Amazon EMRは、分散処理技術であるMapReduceを実装したHadoopフレームワークを、Amazonのインフラ上で稼動させるサービスです。
Hadoopの計算中にノードの追加が可能
実行中のバッチ処理の進行状況にあわせて、柔軟に性能や機能を向上させられる。
ジョブの大きさに合わせてクラスタサイズを適切に調整する事でコストを最適化できる。
ディストリビューションの選択が可能
Apache Hadoop、MapR
拡張ツールのサポート
Hive, Pig, HBaseをサポート
Amazon EMRのデータストアとして、AWSの様々なデータストアを利用する事が可能
Amazon S3, Amazon DynamoDBなどが使える。
Amazon DynamoDBはスループットの設定が自由にできるため、大量のデータを高速に出し入れするときに利用すると良いとのこと。(50万リクエスト/sec 以上のパフォーマンスがあり、TVキャンペーンで使った事例がある。)
Public Data Setsにより計算用サンプルデータの提供
ヒト遺伝子や、米国国勢調査などの情報を使う事ができる。
AWSサービスに計算用データをアップロードするには様々な方法がある
インターネット経由
AWS Direct Connect(専用線サービス)
AWS Import/Export(物理HDDをAmazonに送って、Amazon S3データを転送してくれるサービス 但し東京ではサポートしていないため、一番近いシンガポールを利用するのが良いでしょうとのこと)
Amazon VPCにVPNを接続
NetflixでAWSを使った事例
Cassandra Performance and Scalability on AWS
NetflixはもっともApache CassandraをAmazon EC2上で使っているユーザだそうです。
・おもに北米で、DVD郵送レンタルサービスとビデオストリーミングサービスを提供している。
・ピークタイムには、北米インターネットトラフィックの30%を使う。
参考)Netflix accounts for 30% of U.S. web traffic(link http://www.cbsnews.com/2100-205_162-20063659.html)
・2500万人以上のビデオストリーミング会員を持つ。
・500億以上のイベントデータを持つ。
NetflixはどのようにAWSを使っているか
・Amazon EMR計算用のデータストアはAmazon S3を使っている。
・8テラバイト/日のイベントデータとApache CassandraのバックアップデータをAmazon S3にアップロードしている。
・合計1ペタバイト以上のデータをAmazon S3に保存している。
・Apache Cassandra
以前は、データストアとしてOracleを使っていたが、性能の限界に達したため、書き込み処理がスケールするミドルウェアとしてApache Cassandraを選んだ。
Apache Cassandraのクラスタをマルチリージョンで利用し、可用性を高めている。
PICK UP
-
タグ: ECサイト運営, GMOペパボ, オンラインウェビナー, カゴ落ち対策, カラーミーショップ, カートリカバリー, コラム, セミナー&イベント, 売上アップ, 年末商戦, 無料セミナー, 集客施策
【10/30(水) ウェビナー開催】もうすぐ年末商戦!今から間に合う顧客獲得・売上アップセミナーのご案内 -
タグ: Webサイト多言語変換サービス, shutto翻訳, インバウンド, コラム, セミナー&イベント, ニュース
shutto翻訳は、10月23日から3日間開催の 営業・デジタル マーケティング Week 2024「第14回 デジタル マーケティング EXPO 秋」に出展します! -
タグ: BigQuery, GA4, Googleアナリティクス, googleクラウド, vertexai, コラム, セミナー&イベント, データ活用, マーケティング, 広告最適化, 生成ai
Google アナリティクス の行動データを Google Cloud で活かす方法 -
タグ: instagram活用, shutto翻訳, visomo, インバウンドマーケティング, ウェブマーケティング, オンラインセミナー, コラム, サイト翻訳, セミナー&イベント, デジタルマーケティング, 外国人観光客, 多言語化
≪2024年8月29日(木)オンライン開催≫インバウンド需要を売上につなげるInstagram活用とサイト翻訳 -
タグ: ASEAN越境EC支援, Webサイト多言語変換サービス, shutto翻訳, ウェビナー, クラウドサービス, コラム, セミナー&イベント, ニュース
shutto翻訳、ECサイト構築SaaS「makeshop byGMO」と連携開始 8/30まで連携キャンペーン実施中 -
タグ: ASEAN越境EC支援, Webサイト多言語変換サービス, shutto翻訳, ウェビナー, クラウドサービス, コラム, セミナー&イベント
【7/18(木)開催】円安のいまこそチャレンジのとき! 越境EC最新事情 – shutto翻訳