Hive データ処理における SQL パターンと設定最適化
ユーザー別アクションの上位抽出
ウィンドウ関数を用いて、各ユーザーごとに最も長時間視聴したコンテンツを特定するクエリ例です。サブクエリ内で ROW_NUMBER を使用し、パーティションごとに順位付けを行います。
SELECT user_id, content_id
FROM (
SELECT
user_id,
content_id,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY total_ ...
6月29日 23:11 投稿