分散キーの設定と確認方法

分散キーの設定基準: Greenplumではデータを均等に分散させるために分散キーを使用します。したがって、適切な分散キーを選択することが非常に重要です。 基準: (1)データの分布が均等でNULL値が少ないカラムを分散キーとして選択することが望ましい(主キーは分散キーに最適)。もし主キーが分散キーでない場合、システムは自動的に主キーを分散キーに変更します。 ( ...

6月20日 00:39 投稿

Greenplum 6.5.0におけるGPCCのインストールと設定

GPCC概要 GPCC(Greenplum Command Center)はGreenplumデータベースの監視ツールで、システムリソースのモニタリングやSQL実行状況の確認が可能です。 バージョン互換性の確認 GPCCのインストールではバージョン互換性が重要です。以下の公式ドキュメントで対応バージョンを確認してください: GPCC公式インストールガイド: https://gpcc.docs.pivotal.io/610/topics/in ...

6月13日 19:33 投稿

Greenplumにおけるロールと権限管理の実践

Greenplumにおける権限管理の概要 Greenplumでは、ロール(Role)に基づく権限管理システムが採用されており、ユーザー管理とグループ管理を統一的に扱うことができます。データベース、スキーマ、テーブル、関数など、各オブジェクトに対するアクセス権を細粒度で制御することが可能です。 基本概念と構造 データベース内に複数のスキーマが存在可能 各テーブル、ビュー ...

6月8日 18:49 投稿

Greenplum での拡張プラグインの追加と管理

概要 Greenplum Database(GPDB)は PostgreSQL をベースとしており、多くの PostgreSQL 拡張機能との互換性があります。これにより、pg_trgm(類似度検索)、zhparser(中国語全文検索)、fuzzystrmatch(文字列距離計算)、roaringbitmap(ビットマップ演算)などの有用な拡張を活用できます。本記事では、Greenplum クラスタに拡張プラグインを導入・管理する手順を解説 ...

5月31日 00:07 投稿

Greenplumデータベースのバックアップ戦略:gpbackup/gprestoreとpg_dumpの詳細比較

概要 Greenplumデータベース環境では、大規模データの効率的な保護のために、専用のバックアップツールが提供されています。本記事では、並列処理に特化したgpbackup/gprestoreと、PostgreSQL互換のpg_dump/pg_restoreの機能差異、使用シナリオ、実践的な運用手法について解説します。 gpbackup/gprestoreによる並列バックアップアーキテクチャ gpbackupはGreenplumクラ ...

5月18日 16:47 投稿

GreenPlumデータベースの主要パラメータ最適化ガイド

GreenPlumパラメータ設定の最適化 GreenPlumデータベースのパフォーマンスを最大化するためには、適切なパラメータ設定が不可欠です。本記事では、GreenPlumの主要な設定パラメータをカテゴリ別に解説し、最適化のための具体的な推奨値と設定方法を紹介します。 パラメータの確認と変更コマンド GreenPlumのパラメータは、gpconfigユーティリティを使用して管理します。 ...

5月15日 04:15 投稿

Greenplumにおけるメモリオーバーフローの主なケースと対処法

GreenplumはMPPアーキテクチャを採用した並列処理型データベースであり、大量のメモリを積極的に活用して高速処理を実現する。しかし、メモリ使用量が制御を超えると、セグメントプロセスがOSによって強制終了(OOM Killer)され、クラスタ全体の安定性に深刻な影響を及ぼす可能性がある。 メモリオーバーフローを引き起こす主な要因 ノードあたりの物理メモリ不足 O ...

5月14日 03:35 投稿