クラウドではじめるデータマネジメント

第1回

クラウドで加速するデータマネジメント

クラウドで加速するデータマネジメント

  • Facebook
  • X
  • note

このコンテンツは、当社が執筆している日経クロステック記事「実践DX、クラウドで始めるデータマネジメント 第1回データマネジメントはクラウドと好相性、最新技術トレンドを押さえて賢く利用」の内容を一部要約しつつ独自コンテンツを加えたものです。日経クロステック記事の全文はこちらをご覧ください。

この記事では、データマネジメントにおけるアジリティ(俊敏性)の重要性、および、クラウドの利用がデータマネジメント業務の生産性を高める理由についてご説明します。また、クラウドにおけるデータ基盤技術進化の潮流や最新の技術動向についても解説します。

データマネジメントのアジリティを高めるクラウドの力

データマネジメントにはアジリティー(俊敏性)が求められるようになってきました。様々な調査において、データ活用の成熟度が⾼い企業ほど収益力が高くなるという結果が出ています。データ活用に成功した企業が登場すると、競合企業はさらに優位に立つために、より短期間でデータ活⽤の成果を出したいというニーズが強くなります。

しかしながら、成果を出すまでにはデータの分析と仮説検証を繰り返す必要があります。データ分析のためのデータの統合や分析基盤の整備といったデータマネジメントに時間がかかってしまうと、成果を得るまでに長い時間を要します。よりスピーディー、かつ、柔軟にデータマネジメントを実行できることがデータ活⽤をより早く成功させる必要条件になります。

データマネジメントとクラウドは相性が良い

データマネジメント領域は特に進歩スピードが速く、クラウドでデータマネジメント業務を効率化するサービスが続々と出てきています。データ活用の習熟度が高くない企業では、コストや技術的な難度が高く解決が難しかった課題も、これらの新たなサービスによって解決できる可能性があります。既にデータマネジメントに本格的に取り組んでいる企業にとっても、ベストプラクティスが変わる可能性があります。クラウドは今や、データマネジメント業務の生産性を高く保 ち、スピード感をもってデータ活用を進めていくのに欠かせないツールになっています。

クラウドで起きつつあるプラットフォーム化

従来、クラウドは単一の役割を持つサービスを組み合わせてシステムを構築するようにできており、組み合わせやサービス間の連係は利用者が考えて実行することでした。サービス間でデータを受け渡したり、データにアクセスするサービスに向けて個別にアクセス権限を管理したりする作業です。

しかしここ最近は、サービス間でのデータ連係や、複数のサービスを俯瞰したデータの活用を実現するサービスや製品が出てきています。プラットフォーム化ともいえる動きで、「統合されたサービス」として利用できるようになっています。

クラウドにおけるデータ基盤技術の進化

データ活用が進めば進むほど、利用したいデータへのアクセス権限のリクエストや新たなデータの統合・加工の要求が出てきます。サービス間の連係や管理を個別に実行しようとすると、すぐに業務量が膨れ上がります。

このような課題に対応する新しいサービスが急速に開発されています。活用できるかどうかによってデータ活用のスピードやデータマネジメント業務の生産性が変わります。詳細は以後の記事で説明しますが、現在起きている潮流のポイントをいくつかご紹介します。

ETLレス

データを活用する際は、データを保有している基盤とデータを活用する基盤との間でデータを連係して利用します。これまでは、データ連係ツールを導入して連係処理を管理するか、連係プログラムを書くのが常識でした。現在はクラウドサービス間で対象データを指定すれば自動的に連係する仕組みになっており、「ETLレス」と呼ばれます。

*ETLとはExtract(抽出)Transform(変換)Load(格納)の略で、データ統合時に発生する各プロセスの頭文字をとったものです。

データ仮想化

ETLレスとは異なるアプローチで、別々の場所にあるデータを統合した形で分析できるようにするソリューションが「データ仮想化」です。データ仮想化サービスを使うと、データの物理的な場所を意識せずに統合した形でSQLやデータ分析ツールの画面を使ってデータ分析ができます。

データマネジメントにクラウドがフィットする理由

クラウドには、短期間で基盤を構築・変更できるスピード、必要な期間だけ利⽤できる撤退コストの低さ、様々なサービスを組み合わせられる柔軟性が備わっており、スピード感をもって取り組みたいというニーズにフィットしています。

これらの基盤としての特性の他、データマネジメントのニーズによりよく応えるSaaSが次々に登場していて、上手く利用すると低いコストでアジリティを上げることができます。

クラウドの特長内容データマネジメント業務での効果
拡張性・自動的に容量や処理能力を
拡張させることが可能
データ活用では領域や処理能力の拡張が発生しやすく、効果が大きい
変更のスピード・変更が速い
 (動的、または数分程度で変更が完了)
データ活用で短期間でデータ分析と仮説検証を繰り返す際に恩恵を受けやすい
コスト・使った分だけコストを支払う (従量課金)
・ハードウエア資産をバランスシートから外せる
データ活用では、活用のテーマや分析手法が変わることがあり、撤退コストの影響を受けやすい。従量課金であるメリットが大きい
ハードウェア管理が不要・データセンター、ハードウエアの管理をしなくてよい他の業務システムと同様の効果がある
マネージドサービスがある・OS、ミドルウエア層の運用管理作業の多くが不要になる他の業務システムと同様の効果がある

拡張性

データ活⽤の成果が出始めると、より多くのデータをデータ基盤に格納し、より多くの分析処理を実⾏できるようになります。データ活用のためのデータ基盤では通常の業務システムよりも領域や処理能⼒を拡張する頻度が高いため、高い拡張性を備えるクラウドの特徴を生かしやすいといえます。

変更のスピード

クラウドでは拡張時の基盤構成を変える際、ハードウエア調達やセットアップ作業の期間は不要で、コンソール操作のみで変更ができます。そのためデータ活用に支障を来さずアジリティーを確保できます。

コスト

製品・サービスの利⽤をやめるときに発生するコストを「撤退コスト」といいます。新たなハードウエアやソフトウエアを購入して、既存の背製品・サービスを当初の予定より早くやめるときには当初予定していなかった追加費用が発生します。

データ活⽤においては、活⽤のテーマが変わったり、分析⼿法が変更したりした際に、利⽤するデータ基盤を別の基盤に切り替えたくなるケースがあります。クラウドは従量課⾦で利⽤できるため、⻑期間の固定費は発⽣せず、コストを最適化しやすいというメリットがあります。

データマネジメントに利用できるクラウドサービス

データマネジメントに活用できるクラウドサービスは多様です。大別すると、「ハイパースケーラ」と「特化型SaaS」に分けられます。

ハイパースケーラ

一般的にクラウドサービスに求められる機能をフルラインナップで揃え、システムのすべてのニーズに対応が可能な大規模なクラウドプロバイダー(クラウドサービス事業者)を「ハイパースケーラ」といいます。AWS、Azure、Google Cloud、OC(I Oracle Cloud Infrastructure)などがこれにあたります。

すべてが備わっているので、一元的に調達・管理できるというメリットがあります。また、すでに使っているクラウドであれば、新たにクラウド自体の使い方を学習する必要がなく、データマネジメントにも活用することができ、契約や支払い等の手間も最少で済みます。

特化型SaaS

特定の領域に強く、特徴的なサービスを提供しているプロバイダーを指します。ハイパースケーラに依存せず、どのクラウドでも利用できることもメリットです。特定のニーズをより高度に充足できる可能性があり、フィットすれば非常に良い選択肢になる反面、独自の機能であることが多いため、ベンダーロックインに陥りやすいです。

データマネジメント領域の特化型SaaSベンダーには、Informatica、Qlik、Fivetran、trocco、dbt、ThoutSpot、Dataikuなど多くのサービスがあります。データマネジメントの多くのニーズに対応できるよう複数のデータマネジメント領域対応したプラットフォームとして利用可能なSnowflake、Databricksなどもあります。

ハイパースケーラ、特化型SaaSの他、従来からあるソフトウェア製品が入り乱れて非常に選択肢が多く、「最適な選定」が難しい状況になっています。いずれのベンダーも、誰でもスピーディに利用できるよう、自動化、民主化(非エンジニアでも低コストで利用できる)を指向しているのが最近の動向です。

【参考】データマネジメントに関する用語の解説

データマネジメントに関する代表的な用語を解説をします。ご参考いただければと思います。

データマネジメントとは

「データマネジメント」とは、データの収集、蓄積、提供、保全、廃棄というデータのライフサイクル全体にわたる一連の活動に加えて、分析、活用を含むプロセスのことです。データマネジメントの目的はデータの価値を最大化すること。そのために、データの品質、セキュリティ、利便性を向上させます。

データマネジメントのプロセスを効果的に実行するための技術領域を体系化したフレームワークが「DMBOK2(データマネジメント知識体系バージョン2:Data Management Body of Knowledge)」です。DMBOK2については別の記事で詳しく説明します。フレームワークについて説明している書籍はとてもページ数が多いですが、データマネジメントに関わる方は一度は目を通しておいた方がよいでしょう。

データマネジメントは、データサイエンス、アナリティクスなどのデータ活用を伴う領域と密接に関連しており、データマネジメントの成否がデータの活用によるDXの成果に大きく影響するようになっています。データマネジメントは、企業の意思決定、業務の効率化、変革に重要な役割を果たしています。データマネジメントを効果的に行うことで、企業はデータの価値を最大化し、ビジネスの成功に近づくことができます。

クラウドとは

クラウド(またはクラウドコンピューティング)とは、インターネットを通して、サーバーやストレージ、アプリケーションなどのITリソースをサービスとして利用する形態を指す言葉です。厳密な定義は団体や企業によってさまざまなのですが、共通して次の特徴を備えています。

・ネットワークを通して利用
インターネットなどのネットワークを通じて提供されている

・従量課金
必要な分だけ利用可能で、利用した時間とボリュームに応じて従量課金で料金が発生する

・リソースを共有
クラウドサービス提供事業者(クラウドプロバイダー)は、利用者が使うときに空いているITリソースを提供する。ITリソースは仮想化されており、物理的に決まった場所が提供されるものではない

クラウドを利用すると、企業は自社でITインフラを構築・運用する必要がなくなります。自社で構築する場合と比べて、初期コストと期間が低減され、「データ活用によるDX」をより高速に実行できるようになります。そのため、データマネジメントではクラウドが利用される機会が非常に多くなっています。「クラウドがどのようにデータマネジメントに役立つか」については、他の記事でもテーマに沿ってたびたび触れていきます。

尚、クラウドコンピューティングには以下の3つの形態がありますが、本シリーズでは「パブリッククラウド」のことを「クラウド」と表現しています。

・パブリッククラウド 
一般のユーザーや企業向けにクラウドコンピューティング環境をインターネット経由で提供するサービス。複数のユーザーでリソースを共有し、利用効率を高めることで低コストでのサービス提供を実現している
AWS、Azure、Google Cloud、OCI(Oracle Cloud Infrastructure)等

・プライベートクラウド 
特定の組織・ユーザーのみがアクセス可能な専有クラウドコンピューティング環境を提供するサービス。ユーザは社内のプライベートネットワークを通じてアクセスする。自社・組織でITインフラを構築・運用する必要がある

・ハイブリッドクラウド 
パブリッククラウドとオンプレミス(自社でITリソースを構築・運用する形態)の両方を同時に利用するIT利用形態。適材適所で使い分けることができるのがメリット。

次回以降では、データマネジメントの各業務領域において有用なクラウドサービスについてご説明します。

  • Facebook
  • X
  • note

データマネジメント用語集 初学者やビジネスパーソンにも理解が進みやすい用語集を用意しました データレイク、データマネジメント、データ仮想化、DBREデータマネジメント用語集 初学者やビジネスパーソンにも理解が進みやすい用語集を用意しました データレイク、データマネジメント、データ仮想化、DBRE

データ活用DXご支援メニュー

データベース内製化データベース内製化
データベースのクラウド移行データベースのクラウド移行
パートナー調達支援パートナー調達支援
データベース信頼性エンジニアリング(データベース運用)データベース信頼性エンジニアリング(データベース運用)
データ活用基盤の立案・構築データ活用基盤の立案・構築

メールでお問い合わせContact