主要アルゴリズムとデータ構造の実践: セグメントツリー、ハンガリー法、素因数分解Union-Find

競技プログラミング問題解決のヒント

競技プログラミングでは、時間計算量の制約をクリアするために効率的なアルゴリズムやデータ構造の理解が不可欠です。以下に、いくつかの実践的なアプローチとコード例を紹介します。

繰り返しの多いクエリに対する前計算（累積和）

多数のクエリに対して同じ計算を繰り返す場合、事前に結果を前計算しておくことで、各クエリの処理時間を大幅に短縮できます。特に区間和や区間最大値など、隣接する要素の情報を利用して計算できる場合、累積和（または累積最大値など）の考え方が有効です。

例えば、広範囲のクエリにおいて結果に重複性がある場合、O(N)で前計算を行い、各クエリをO(1)で処理することで、全体でO(N+Q)の時間計算量を実現できます。

二部グラフの最大マッチング：ハンガリー法

ハンガリー法は、二部グラフにおける最大マッチングを求めるための古典的なアルゴリズムです。多くの組み合わせ最適化問題に応用されます。

以下は、深さ優先探索（DFS）を利用したハンガリー法の典型的な実装例です。このアルゴリズムは、各頂点uに対して、まだマッチングされていない頂点vを見つけ、もしvが既にマッチングされている場合は、そのマッチングを再帰的に他の頂点に「譲る」ことを試みることで、最大マッチングを構築します。


#include <iostream>
#include <vector>
#include <numeric> // for iota
#include <algorithm> // for std::fill

const int MAX_NODES = 200000 + 10; // 最大ノード数

std::vector<int> adjList[MAX_NODES]; // 隣接リスト
int matchR[MAX_NODES];              // R側の頂点とマッチするL側の頂点
bool visited[MAX_NODES];            // DFS中に訪問済みか

// DFSを用いてマッチングを試みる
bool find_match(int u) {
    for (int v : adjList[u]) {
        if (visited[v]) continue; // 既に現在のDFSで訪問済みのR側の頂点はスキップ
        visited[v] = true;

        // vがまだマッチングされていないか、
        // もしくはvにマッチしているL側の頂点から別のマッチングを探せる場合
        if (matchR[v] == 0 || find_match(matchR[v])) {
            matchR[v] = u; // L側のuとR側のvをマッチさせる
            return true;
        }
    }
    return false; // マッチングを見つけられなかった
}

void solve_matching_problem() {
    int N_left, M_edges; // L側の頂点数、辺の数
    std::cin >> N_left >> M_edges;

    // 隣接リストを初期化
    for(int i = 1; i <= N_left; ++i) adjList[i].clear();
    // matchR配列を0で初期化（1-indexedに対応）
    std::fill(matchR + 1, matchR + N_left + 1, 0); 

    for (int i = 0; i < M_edges; ++i) {
        int u, v;
        std::cin >> u >> v;
        adjList[u].push_back(v); // 単方向辺として追加（L側からR側への辺）
    }

    int max_matching_count = 0;
    for (int i = 1; i <= N_left; ++i) { // L側の各頂点についてマッチングを試みる
        // 各DFSの開始前にvisited配列をリセット（1-indexedに対応）
        std::fill(visited + 1, visited + N_left + 1, false);
        if (find_match(i)) {
            max_matching_count++;
        }
    }
    std::cout << max_matching_count << std::endl;
}

int main() {
    std::ios::sync_with_stdio(false);
    std::cin.tie(nullptr);
    solve_matching_problem(); 
    return 0;
}

区間操作とクエリを高速化するセグメントツリー

セグメントツリーは、配列の区間に対するクエリ（区間和、区間最小値など）や更新（単一点更新、区間更新）を高速に処理するための強力なデータ構造です。特に、遅延評価（Lazy Propagation）を用いることで、区間更新操作も効率的に行えます。

以下は、区間和のクエリと区間加算の更新をサポートするセグメントツリーの実装例です。


#include <iostream>
#include <vector>
#include <algorithm>

const int MAX_ARRAY_SIZE = 200000 + 10; // 元の配列の最大サイズ

long long initial_array[MAX_ARRAY_SIZE]; // 元の配列のデータ

// セグメントツリーのノード構造体
struct SegmentTreeNode {
    long long left_bound, right_bound; // ノードが担当する区間の左右端
    long long sum_value;               // 区間和
    long long lazy_add;                // 遅延評価用の加算値
};

SegmentTreeNode tree_nodes[MAX_ARRAY_SIZE * 4]; // セグメントツリーの配列（通常、元の配列サイズの4倍の空間が必要）

// 子ノードの情報を親ノードに反映
void propagate_up(int parent_idx) {
    tree_nodes[parent_idx].sum_value = tree_nodes[parent_idx * 2].sum_value + tree_nodes[parent_idx * 2 + 1].sum_value;
}

// 親ノードの遅延評価値を子ノードに伝播
void propagate_down(int parent_idx) {
    if (tree_nodes[parent_idx].lazy_add != 0) {
        // 左の子ノードに伝播
        long long left_child_len = tree_nodes[parent_idx * 2].right_bound - tree_nodes[parent_idx * 2].left_bound + 1;
        tree_nodes[parent_idx * 2].sum_value += left_child_len * tree_nodes[parent_idx].lazy_add;
        tree_nodes[parent_idx * 2].lazy_add += tree_nodes[parent_idx].lazy_add;

        // 右の子ノードに伝播
        long long right_child_len = tree_nodes[parent_idx * 2 + 1].right_bound - tree_nodes[parent_idx * 2 + 1].left_bound + 1;
        tree_nodes[parent_idx * 2 + 1].sum_value += right_child_len * tree_nodes[parent_idx].lazy_add;
        tree_nodes[parent_idx * 2 + 1].lazy_add += tree_nodes[parent_idx].lazy_add;

        tree_nodes[parent_idx].lazy_add = 0; // 伝播後、親の遅延値をリセット
    }
}

// セグメントツリーの構築
void build_segment_tree(int node_idx, int left_idx, int right_idx) {
    tree_nodes[node_idx] = {static_cast<long long>(left_idx), static_cast<long long>(right_idx), 0, 0};
    if (left_idx == right_idx) {
        tree_nodes[node_idx].sum_value = initial_array[left_idx];
        return;
    }
    int mid_idx = left_idx + (right_idx - left_idx) / 2;
    build_segment_tree(node_idx * 2, left_idx, mid_idx);
    build_segment_tree(node_idx * 2 + 1, mid_idx + 1, right_idx);
    propagate_up(node_idx); // 子ノードから親ノードへ情報を集約
}

// 区間更新 (指定された区間 [query_left, query_right] に value を加算)
void range_update(int node_idx, int query_left, int query_right, int value) {
    // 現在のノードの区間がクエリ区間に完全に含まれる場合
    if (tree_nodes[node_idx].left_bound >= query_left && tree_nodes[node_idx].right_bound <= query_right) {
        long long current_node_len = tree_nodes[node_idx].right_bound - tree_nodes[node_idx].left_bound + 1;
        tree_nodes[node_idx].sum_value += current_node_len * value;
        tree_nodes[node_idx].lazy_add += value;
        return;
    }

    propagate_down(node_idx); // 子ノードに遅延値を伝播

    int mid_idx = tree_nodes[node_idx].left_bound + (tree_nodes[node_idx].right_bound - tree_nodes[node_idx].left_bound) / 2;
    // クエリ区間が左の子ノードの区間と重なる場合
    if (query_left <= mid_idx) {
        range_update(node_idx * 2, query_left, query_right, value);
    }
    // クエリ区間が右の子ノードの区間と重なる場合
    if (query_right > mid_idx) {
        range_update(node_idx * 2 + 1, query_left, query_right, value);
    }
    propagate_up(node_idx); // 子ノードの更新を親ノードに反映
}

// 区間クエリ (指定された区間 [query_left, query_right] の和を計算)
long long range_query(int node_idx, int query_left, int query_right) {
    // 現在のノードの区間がクエリ区間に完全に含まれる場合
    if (tree_nodes[node_idx].left_bound >= query_left && tree_nodes[node_idx].right_bound <= query_right) {
        return tree_nodes[node_idx].sum_value;
    }

    propagate_down(node_idx); // 子ノードに遅延値を伝播

    long long current_sum = 0;
    int mid_idx = tree_nodes[node_idx].left_bound + (tree_nodes[node_idx].right_bound - tree_nodes[node_idx].left_bound) / 2;
    // クエリ区間が左の子ノードの区間と重なる場合
    if (query_left <= mid_idx) {
        current_sum += range_query(node_idx * 2, query_left, query_right);
    }
    // クエリ区間が右の子ノードの区間と重なる場合
    if (query_right > mid_idx) {
        current_sum += range_query(node_idx * 2 + 1, query_left, query_right);
    }
    return current_sum;
}

複雑なシミュレーションのデバッグテクニック

複雑なシミュレーション問題や複数のロジックが絡む問題では、デバッグが困難になることがあります。そのような場合、以下の手法が有効です。

単純な暴力解法との比較: 可能であれば、比較的実装が容易な「暴力的な」解法（例：探索範囲が小さい場合は全探索、グラフの場合はDijkstraなど）を別に実装し、両方の解法を同じテストケースで実行します。
多数のランダムテストケース生成: テストケースを大量に自動生成し、両方の解法の結果が異なる最初のケースを見つけます。この「異なるケース」は、バグを特定する上で非常に貴重な手がかりとなります。
差分検出: 異なる出力が見つかったら、そのケースでの両方の実装の内部状態やステップを詳細に比較し、どこでロジックの乖離が発生したかを特定します。

素因数分解とUnion-Findを用いたグループ化

与えられた複数の数値について、共通の素因数を持つものをグループ化する問題では、素因数分解とUnion-Findデータ構造を組み合わせる手法が効果的です。同じ素因数を持つ数値は、同じ集合に属すると見なすことができます。


#include <iostream>
#include <vector>
#include <numeric> // for std::iota
#include <algorithm> // for std::fill

const int MAX_VALUE_N = 1000000 + 10; // 数値の最大値
const int MAX_ARRAY_LENGTH = 1000000 + 10; // 入力配列の最大要素数

std::vector<int> prime_factors_list[MAX_VALUE_N]; // prime_factors_list[i]: iの素因数リスト
int parent_set[MAX_ARRAY_LENGTH];                 // Union-Findの親配列
int first_occurrence_idx[MAX_VALUE_N];            // 各素因数が最初に出現した入力配列のインデックス (1-indexed)

// Union-Findのfind操作（経路圧縮付き）
int find_set(int i) {
    if (parent_set[i] == i)
        return i;
    return parent_set[i] = find_set(parent_set[i]);
}

// 素因数を事前に計算（エラトステネスの篩の応用）
void precompute_prime_factors() {
    for (int i = 2; i < MAX_VALUE_N; ++i) {
        if (prime_factors_list[i].empty()) { // iがまだ素因数としてマークされていない場合（=素数である場合）
            for (int j = i; j < MAX_VALUE_N; j += i) {
                prime_factors_list[j].push_back(i); // iの倍数jにiを素因数として追加
            }
        }
    }
}

void process_test_case() {
    int N_elements; // 入力配列の要素数
    std::cin >> N_elements;

    std::vector<int> input_values(N_elements + 1); // 1-indexedで要素を格納
    std::vector<int> primes_touched_in_this_case; // このテストケースでfirst_occurrence_idxを更新した素因数を記録

    // Union-Findを初期化 (各要素が自身の集合の代表となる)
    std::iota(parent_set + 1, parent_set + N_elements + 1, 1);
    
    // first_occurrence_idxは各テストケースごとにリセットが必要
    // 全体をfillする代わりに、実際に更新した素因数のみをリセットする
    // (効率のためにprimes_touched_in_this_caseに記録)

    for (int i = 1; i <= N_elements; ++i) {
        std::cin >> input_values[i];
        for (int prime_factor : prime_factors_list[input_values[i]]) {
            if (first_occurrence_idx[prime_factor] == 0) { // この素因数が初めて出現した場合
                first_occurrence_idx[prime_factor] = i; // 現在の入力配列のインデックスを記録
                primes_touched_in_this_case.push_back(prime_factor); // 後でリセットするために記録
            } else {
                // 既にこの素因数が出現している場合、現在の数値のグループと、
                // 以前にこの素因数を持っていた数値のグループを結合
                int root_current = find_set(i);
                int root_first = find_set(first_occurrence_idx[prime_factor]);
                if (root_current != root_first) { // 異なるグループなら結合
                    parent_set[root_current] = root_first;
                }
            }
        }
    }
    
    // このテストケースで更新したfirst_occurrence_idxのエントリのみをリセット
    // これをしないと、次のテストケースで古い情報が残ってしまう
    for (int p_factor : primes_touched_in_this_case) {
        first_occurrence_idx[p_factor] = 0;
    }

    int root_of_first_element = find_set(1); // 最初の要素が属するグループの代表
    int groups_different_from_first = 0;
    for (int i = 1; i <= N_elements; ++i) {
        // 最初の要素のグループとは異なるグループに属する要素の数を数える
        if (find_set(i) != root_of_first_element) {
            groups_different_from_first++;
        }
    }

    if (groups_different_from_first == 0) {
        std::cout << "-1 -1\n"; // 全ての要素が同じグループに属する場合（分割不可能）
        return;
    }

    // 分割された2つのグループのサイズを出力
    std::cout << groups_different_from_first << " " << N_elements - groups_different_from_first << "\n";
    
    // 最初の要素のグループとは異なるグループに属する要素を出力
    for (int i = 1; i <= N_elements; ++i) {
        if (find_set(i) != root_of_first_element) {
            std::cout << input_values[i] << " ";
        }
    }
    std::cout << "\n";
    
    // 最初の要素のグループに属する要素を出力
    for (int i = 1; i <= N_elements; ++i) {
        if (find_set(i) == root_of_first_element) {
            std::cout << input_values[i] << " ";
        }
    }
    std::cout << "\n";
}

int main() {
    // 高速I/O
    std::ios::sync_with_stdio(false);
    std::cin.tie(nullptr);
    std::cout.tie(nullptr);

    precompute_prime_factors(); // 素因数を一度だけ前計算

    int num_test_cases;
    std::cin >> num_test_cases;
    while (num_test_cases--) {
        process_test_case();
    }
    return 0;
}

タグ: セグメントツリー遅延評価ハンガリー法二部マッチング Union-Find

6月21日 22:28 投稿

異端開発室