セクションを選択

データ管理とは

URL をコピー

データ管理は、データを収集し、保存し、使用するプロセスで、その実現には多くの場合、データ管理ソフトウェアが使用されます。データ管理により、組織が所持するデータの内容、保存場所、所有者、閲覧権限を持つ人、およびアクセス方法を把握できます。また、データ管理は、組織が重要なシステムやアプリケーションを安全かつコスト効率よくデプロイし、戦略的な意思決定を行うことを可能にします。  

広義のデータ管理では、エンタープライズデータ管理 (EDM) と呼ばれる専門領域があります。EDM はビジネスのデータのインベントリーを作成して規定するプロセスで、組織がこのプロセスに準拠するよう支援します。

十全なデータ管理戦略を策定すれば、変化するビジネスプロセスとニーズに適応し、それらに応じて拡張することが可能になり、チームはより迅速かつスマートに行動するための情報と自信を得られます。

データ管理システムを活用する組織は、適切な人々に適切なタイミングで情報を提供することが容易になります。適切に制御および実装されたデータ管理ワークフローがあれば、よりよい意思決定を行うために必要な分析的知見を得ることができます。データ管理は、ビジネスに不可欠な情報の安全性、アクセス可能性、スケーラビリティを確保するために必要な手段です。データ管理プロセスは次のような機能を備えている必要があります。

  • インフラストラクチャ全体でデータを生成および厳選する
  • クラウドやオンプレミスでデータの保存とスケーリングができる
  • 高可用性 (HA) を確立する 
  • 障害復旧を計画する
  • 可能な限りの場所と方法で、データへのアクセスを保護および制御する
  • コンプライアンス要件を満たすためにデータを監査および破棄する 
  • データサービスを通じてインテリジェントなアプリの作成を促進する

データガバナンスは、データ管理ソリューションの重要な要素です。明確なガイドラインとプロトコルを設定し、データの精度、使いやすさ、セキュリティを維持します。堅固なガバナンスがなければ、データ管理は無秩序で整合性を欠いたものになります。データ管理には、組織のデータの作成、厳選、および出力が含まれますが、データガバナンスは、組織の内部基準とポリシーだけでなく関連する外部規制にも従って、データの使用とセキュリティを管理します。

データ管理には、アーキテクチャに関連する多くの要素が含まれており、組織がエンタープライズデータのニーズに対処する際にはそれらを考慮する必要があります。データ管理のこれらの側面により、データは戦略的資産になります。 

  • データストレージ:デジタル情報 (アプリケーション、ネットワークプロトコル、ドキュメント、メディア、アドレス帳、ユーザー設定などを構成する情報) を収集および保持します。
  • データ準備:生データを分析可能な状態にし、エラーを修正し、さまざまなソースを統合します。
  • データカタログ:メタデータを分類して、ユーザーが自分にとって重要なデータを容易に検索し、理解し、使用できるようにします。
  • データウェアハウス:レポートを目的として構造化されたモデルにデータを保存します。 
  • ETL (Extract、Transform、Load):データベースからデータを抽出し、それを新しい形式に変換して、データウェアハウスに書き出します。
  • データパイプライン:受信データをあるシステムから別のシステムにリアルタイムで自動的に転送して処理します。
  • データレイク:大規模で多様な非構造化データ一式をネイティブ形式で保存し、データの未加工のビューを維持できるようにします。 
  • データ・アーキテクチャ:データの収集、保存、転送、および消費の方法を正式に定義します。
  • データモデリング:データがビジネスまたはアプリケーション内をどのように移動するかを示します。
  • データメッシュ:分析データを分散化して、チーム間やロケーション間でのアクセス可能性と可用性を向上します。
  • データグリッド:組織のコンピュータを集合的に活用して、大規模なタスクを完了します。 
  • データフェデレーション:複数のソースからデータを収集し、それらが一緒に機能するように準備します。

データベース管理システム (DBMS) は、ビジネスプロセス管理エンタープライズ・リソース・プランニング (ERP) ツールと同様に、このようなデータ管理を自動化または監視するために使用されるデータ管理システムです。それに対してデータ管理ソフトウェアは、組織中の大量のデータを収集、分析、統合するための基盤となるプラットフォームとして機能します。多くの場合データベースベンダーまたはサードパーティベンダーが開発したツールを搭載し、シームレスなデータ運用を実現します。

エンタープライズデータ管理システムは大規模組織向けに DBMS を進化させた形態で、データ整合性、セキュリティ、多様な部門からのアクセス性を実現します。リレーショナル DBMS は SQL プログラミング言語を利用してデータを構造化し、接続します。一方で NoSQL データベースは非構造化データに適しています。

データには価値がありますが、データの保護と処理が可能で、実行可能なアクションに移すことができる場合に限ります。データの活用には大きな見返りがありますが、複雑でもあります。データは組織に大量かつ高速で送り込まれるため、次のような課題に備えておく必要があります。 

  • 量:組織に流入するデータはサイズが大きく、形式も異なるため、組織が所持するデータの種類やその保存場所は簡単に把握しきれなくなってしまいます。 
  • データ統合とデータ同期:データが複雑になるほど、さまざまなソースからのデータを効率的かつ戦略的に統合することが難しくなります。  
  • サイロ:統合されていないデータは連携することができないため、価値を引き出せず、リソースが無駄になります。 
  • データの保存と処理:効果を最大化するためには、IT チームがデータの保存場所と処理方法を決定する必要があります。 
  • コスト:データ処理とストレージは、オンプレミスで管理する場合でもクラウドで管理する場合でも、コストがかかります。これらのコストを、ビジネス目標やデータの価値とともに評価することが重要です。 
  • コンプライアンス:業界およびデータのプライバシー基準に準拠していない場合、罰金、データセキュリティ違反、認定の喪失など、ビジネスへの損害が生じる可能性があります。 
  • データグラビティ:データには、その質量に応じてアプリケーションとサービスを引き付ける力があります。大規模なデータセットとそれらが引き付ける構成要素は、時間の経過とともに移動が難しくなります。 

ビッグデータは従来のデータ処理方法では扱うことができないほど非常に大きく複雑なデータです。高度なデータ分析ツールが必要となる場合がよくあります。ビッグデータ管理は、ビジネスの改善に利用できるリアルタイムの情報を提供できるよう、このデータを整理および管理します。

ビッグデータの分類と分析により、さまざまなソースから重要な情報をすばやく見つけることができます。大規模なデータセットの統合、クリーンアップ、および管理は難しい場合がありますが、強力なアーキテクチャと巧妙なデータ戦略を確立すると、効率的な拡張、ビジネス目標の達成、高品質のデータ分析の収集に役立ちます。ビッグデータには、統合と自動化をサポートする管理プラットフォームが必要です。

データライフサイクル管理 (DLM) とは、生成から削除まで、データの存続期間を通じてデータを制御および管理する人、特にデータ管理ツール、およびプロセスです。データのライフサイクルには、データの取得、保存、共有、アーカイブ、破棄が含まれます。

DLM 戦略では、情報の安全性、正確性、アクセス可能性を維持し、一般データ保護規則 (GDPR) などの規制要件に準拠する必要があります。DLM 製品は多くの場合、このプロセスを自動化し、ガバナンスポリシーに基づいてデータを階層に分割し、状況に応じて階層間でデータを移行します。

マスターデータは、トランザクションデータのコンテキストを提供する共有された重要なビジネス情報で、主要な組織機能を可能にします。ビジネストランザクションの基盤を提供し、組織がシステム間で一貫してデータを比較できるようにします。マスターデータを構成するエンティティには、顧客、製品、場所などがあります。 

マスターデータ管理 (MDM) ソフトウェアは、エンタープライズ全体でコアビジネスデータの精度、整合性、配信を一元管理する機能を提供します。MDM 戦略を統合することで、重要なデータがシステム間で分離されたり、サイロ化されたりするのを回避できます。また、信頼できる唯一の情報源を維持することにより、エラーの悪化を防ぐことができます。 

MDM システムは、さまざまなストリームにわたるエンタープライズのマスターデータの概要のほか、リアルタイムのデータ可視化とセキュリティ機能を提供する必要があります。

データ管理プラットフォームは、エラーの特定と解消、リソースの分割、パフォーマンス向上のためのシステム最適化など、データ管理の多くの重要な機能を実行します。これらの機能の多くは自動化されるため、コスト削減と効率の向上につながります。このプラットフォームを使用する場合、データ管理のベストプラクティスを常に把握しておくことが重要です。 

  • 組織が所持しているデータを評価する: IT チーム、データサイエンティスト、経営幹部が、生成するデータとその価値について理解していることが重要です。 
  • ビジネス目標に関連するデータを保持する: 不要なデータを保持する必要はありません。ビジネスに影響を与えるデータを把握することで、システムが最適化され、保守が単純化され、重要なデータを見つけやすくなります。
  • データベースを最適化する:さまざまなデータソースから抽出する際、データベースを確実に拡張および実行できるようにしましょう。多くのデータベースは、高度なアルゴリズムと機械学習および人工知能の機能を提供します。これらは、データから得られる情報に基づいたビジネス上の意思決定を支援するためのものです。 
  • 高いデータ品質を維持する: 定期的な更新からスペルやフォーマットの修正まで、定期的な品質チェックを行い、データを正確かつ最新の状態に保ちましょう。 
  • データを管理し、適切な人々がデータにアクセスできるようにする: データの整合性、つまり、データの使用方法、保存方法、表示方法の一貫性を確保できるように、チーム、ポリシー、およびシステムを配置しましょう。 
  • セキュリティとコンプライアンスに重点を置く: 規制に準拠し、ビジネスインテリジェンスとデータを安全に保つために、チームをトレーニングし、システムを保護しましょう。  

IDC によると、Red Hat® Enterprise Linux® はその安定性、セキュリティ、パフォーマンスにより、多くのお客様のビジネスクリティカルなデプロイメントに採用されています。また、オンプレミス、仮想化、クラウド、エッジなど、インフラストラクチャのあらゆるフットプリントにわたって一貫性を提供することもその要因になっています。データ管理ソリューションを一元化することで、アジリティを維持し、進化する変革とイノベーションの目標を達成できます。

Red Hat Enterprise Linux には、MariaDB、MySQL、PostgreSQL など、人気のあるオープンソース・データベース・サーバーが多数含まれています。これらのデータベースパッケージの複数のバージョンがアプリケーションストリームとして提供され、コア・オペレーティングシステム・パッケージよりも頻繁に更新されます。このため、プラットフォームや特定のデプロイメントが持つ安定性を損なうことなく、Red Hat Enterprise Linux の柔軟性が向上します。

オープンソース・データベースに加えて、Red Hat Enterprise Linux は商用データベース管理システムのパフォーマンス、管理性、信頼性も向上させています。以下に例を示します。

Red Hat Enterprise Linux for SAP® Solutions は、ビジネスクリティカルなワークロード向けに設計されています。SAP の顧客が Linux で標準化して、自信を持ってモダナイズできるようにするプラットフォームです。顧客は SAP 向けの Red Hat Insights ダッシュボードを使用して、システムを容易に分析して管理できます。当社のテクノロジーにより、システムロール、ライブカーネルパッチ、メモリー保護など、市場をリードする機能によって効率を実現します。お客様は SELinux およびその他の高度なセキュリティ機能を活用して、セキュリティを優先できます。Red Hat Enterprise Linux は SAP S/4HANA® on Power LE 向けに SAP が認定した唯一の高可用性ソリューションでもあり、オープンハイブリッド・プラットフォームによってアプリケーションおよびサービスをオンプレミスまたはクラウドに提供しています。

Red Hat Enterprise Linux は、パフォーマンスを重視した、Microsoft SQL Server 向けの費用効果の高いプラットフォームです。これにより、組織は大量のデータを迅速に処理し、増大する運用上および分析上の要求に対応することができます。デプロイ先がベアメタル、仮想マシン、コンテナ、またはハイブリッドクラウド環境のいずれであっても、スケーラブルな基盤と一貫したアプリケーション・エクスペリエンスを提供します。組み込みの分析機能により、セキュリティ、パフォーマンス、可用性、および安定性に対する脅威を識別し、問題、停止、計画外のダウンタイムを回避するための修復ガイダンスを提供します。マイクロソフトは Red Hat Enterprise Linux を Linux で稼働する SQL Server のリファレンス・プラットフォームとして使用しており、RHEL 8 は記録的な SQLServer パフォーマンスを提供します。 

Red Hat OpenShift® Data Science は、インテリジェント・アプリケーションに携わるデータサイエンティストおよび開発者向けのマネージド・クラウドサービスです。フルサポート付きのサンドボックスを備えており、本番環境にデプロイする前に、パブリッククラウドで機械学習 (ML) モデルを迅速に開発、トレーニング、テストすることができます。 

Red Hat Enterprise Linux の詳細はこちら