歡迎您光臨本站 註冊首頁

Linux下如何尋找相同文件的方法

←手機掃碼閱讀     limiyoyo @ 2020-06-24 , reply:0

隨著電腦的使用,系統裡將產生很多垃圾,最典型的就是同一份文件被保存到了不同的位置,這樣導致的結果就是磁盤空間被大量佔用,系統運行越來越慢。

所以如果你的電腦空間告急的話,可以試著去刪除這樣的文件,釋放一些空間。在 Linux 下,我們可以通過識別文件的 inode 值來找出系統中的相同文件。

inode 是一個數據結構,記錄了文件所有信息,除了文件名和文件內容。如果兩個或多個文件具有相同的 inode 值,即使它們的文件名不一樣,位置不一樣,它們的內容、所有者、權限其實都是一樣的,我們可以將其視有相同文件。

這類型的文件其實就是所謂的「硬鏈接」。硬鏈接具有相同的 inode 值,但文件名不一樣。而軟鏈接其實就是快捷方式,它指向目標文件,但有著自己的 inode 值。

  $ ls -l my*  -rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 myfile  lrwxrwxrwx 1 liangxu liangxu   6 Apr 15 11:18 myref -> myfile  -rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 mytwin

 

我們無法直接知道同一目錄下有哪些文件是有相同的 inode 值,但要識別起來也不難。其實我們只要使用 ls -i 命令,再以 inode 值進行排序,就可以直接找到這些文件。

  $ ls -i | sort -n | more   ...   788000 myfile  <==   788000 mytwin  <==   801865 Name_Labels.pdf   786692 never leave home angry   920242 NFCU_Docs   800247 nmap-notes

 

在這個結果的第一列裡,就是對應的 inode 值。所以從這個結果裡我們一眼就可以看出來,哪些文件具有相同 inode 值。

如果你只是想找到一個文件的對應硬鏈接文件,我們可以使用 find 命令,再加個 -samefile 選項即可快速找到。

  $ find . -samefile myfile  ./myfile  ./save/mycopy  ./mytwin

 

這些文件都是有相同的 inode 值,不信的話可以再使用 ls 命令來查看更多信息:

  $ find . -samefile myfile -ls   788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./myfile   788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./save/mycopy   788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./mytwin

 

我們可以看到,除了文件名之外,這幾個文件名的信息完全一樣。細心的朋友可能會注意到,在第2列(硬連接數)是4,而實際上我們找出來的文件只有3個,這說明還有一個文件與他們共享 inode 值,只是我們通過這條命令沒有找出來而已。

作為一個懶人,每次敲命令多麻煩,直接上腳本找出目錄下的相同文件!

  #!/bin/bash    # seaches for files sharing inodes    prev=""    # list files by inode  ls -i | sort -n > /tmp/$0    # search through file for duplicate inode #s  while read line  do    inode=`echo $line | awk '{print $1}'`    if [ "$inode" == "$prev" ]; then      grep $inode /tmp/$0    fi    prev=$inode  done < /tmp/$0    # clean up  rm /tmp/$0

 

運行結果:

  $ ./findHardLinks   788000 myfile   788000 mytwin

 

當然了,你還可以使用 find 命令,根據 inode 值,找到系統裡所有相同文件。

  $ find / -inum 788000 -ls 2> /dev/null   788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /tmp/mycopy   788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/myfile   788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/save/mycopy   788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/mytwin

 

在這條命令裡,我們將錯誤提示重定向到 /dev/null 這個特殊文件裡,這樣在搜索一些我們沒有權限訪問的路徑時,不會滿屏的 permission denied 。


[limiyoyo ] Linux下如何尋找相同文件的方法已經有251次圍觀

http://coctec.com/docs/linux/show-post-239560.html