Hive データ処理における SQL パターンと設定最適化

ユーザー別アクションの上位抽出 ウィンドウ関数を用いて、各ユーザーごとに最も長時間視聴したコンテンツを特定するクエリ例です。サブクエリ内で ROW_NUMBER を使用し、パーティションごとに順位付けを行います。 SELECT user_id, content_id FROM ( SELECT user_id, content_id, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY total_ ...

6月29日 23:11 投稿