Linuxのsortとuniqコマンドの詳細解説

テキストファイルの内容を行単位で並び替えるためのコマンドです。

sort [オプション] [ファイル名]

主なオプション：

比較は各行を単位として、先頭からASCIIコード値で比較し、昇順に出力されます。

ls -l | sort -n -k5

これは、5番目のフィールドを数値順にソートします。-tオプションで区切り文字を指定することも可能です。

元データ	デフォルトソート結果	-uオプション使用	-oオプション使用
apple pear orange pear 1 2 10	1 10 2 apple orange pear pear	1 10 2 apple orange pear	sort test.txt > test.txt ではファイルが空になる sort test.txt -o test.txt で正しく書き込み可能

sort -t ' ' -k 3nr -k 2n facebook.txt

3番目のフィールドで降順ソートし、同じ場合は2番目のフィールドで昇順ソートします。

ソートされたデータから重複行を取り除くコマンドです。

uniq [オプション] [入力ファイル] [出力ファイル]

主なオプション：

※ 重複していない行が隣接していない場合、uniqは正常に動作しないため、事前にsortでソートしておく必要があります。

元データ	-cオプション	-uオプション
e bsd 1000 600 4M c win7 2000 100 7G d winxp 4000 300 3G d winxp 500 300 3G g winxp 500 300 3G g winxp 500 300 3G G WINXP 500 300 3G	1 e bsd 1000 600 4M 1 c win7 2000 100 7G 1 d winxp 4000 300 3G 1 d winxp 500 300 3G 2 g winxp 500 300 3G 1 G WINXP 500 300 3G	e bsd 1000 600 4M c win7 2000 100 7G d winxp 4000 300 3G d winxp 500 300 3G G WINXP 500 300 3G

6月16日 22:20 投稿

異端開発室