更新記錄:
  • 改善演算法,提高在比對大量圖片時的速度。
  • 提高載入資料庫的速度。
  • 一些錯誤修正。
  • 可以正常在 64-bit 作業系統底下運作了。

圖片愈抓愈多,不小心重複或類似的也就可能愈來愈多,要自己一張張去人眼比對,絕對是一件吃力不討好的事,所以就有人寫出了自動搜尋重複圖片的工具。在之前我都是用 VisiPics,前不久它也有推出新版本,還挺不錯的,只可惜它不支援 Unicode。最近我發現另一個也是很棒的工具,功能很齊全、操作很簡便、支援 Unicode、還支援多執行緒,讓搜尋更快速。

這款工具的名稱叫 AntiDupl.Net,看名字就知道是用 .Net 寫成的,你必須事先安裝 .Net framework 2.0 以上才能執行。

其實它的用法很直覺,不用做什麼設定就能使用了,但因為它是俄國人寫的軟體,英文介面也寫得不是很清楚,所以就一步步跟各位介紹吧。

1. 首先當然是去 AntiDupl.Net 的官方網頁下載最新版,最上方那個連結就是了。

AntiDupl.Net-01

2. 下載完成會得到一個自解壓縮檔,它不用安裝,解壓縮到任一目錄即可馬上執行。它的介面很簡單,左上方的按鈕列那個像齒輪的按鈕按下去就能開啟設定視窗。

AntiDupl.Net-06

3. 設定視窗裡頭的「Check」分頁,基本上我們可以完全照預設值就好,若是你想要檢查旋轉過的圖片,那就把第三個「Search rotated and mirror mage dupls」打勾,這樣就算是圖片經過旋轉或翻轉,也能判定是否是相似的,當然勾選這個項目之後,會增加不少檢查的時間。

AntiDupl.Net-02

4. 再來切換到「Advanced」分頁,這裡也是依照預設值就很夠用了。先前我提到過,它在比對圖片時支援多執行緒,它預設會根據你 CPU 的核心來決定開幾條執行緒,不過你也可以自己改。「Compare threads count」這個下拉選單就是改執行緒個數的,若是你電腦是這一兩年買的,可以將執行緒開到 4 試看看,可提升不少比對速度。

「Normalized image size」則會影響比對的精準度,這個數值愈大,比對的正確率就愈高,當然花的時間也愈久。我個人是覺得預設的 32x32 就很不錯了啦。

AntiDupl.Net-03

5. 再來回到主畫面,按鈕列那邊有個看起來像資料夾的按鈕,按下去就會出現搜尋路徑設定視窗。

在「Search」分頁你可以指定要搜尋的目錄,它會自動包含子目錄,你可以在這裡加入多組目錄或檔案。在這裡加入的目錄或檔案都會一起被比對,所以就算是不同目錄裡頭有相同的檔案也會被找出來。在「Ignore」分頁你可以指定要略過的目錄。在「Valid」分頁你可以指定已經檢查過的目錄,這樣它就不會再去比對這些目錄。在「Delete」分頁你可以指定要優先被刪除的目錄,若你沒有指定的話,程式預設會自動選擇品質比較糟的圖片當做要被刪除的對象。

AntiDupl.Net-04

6. 設定完畢之後就按下按鈕列那個看起來像播放的按鈕吧,這就是它的搜尋比對視窗,此時我開了四條執行緒在比對。雖然開了四條執行緒,但我還是可以挺順暢的執行其他程式,而且我的電腦配備並沒有特別的好。

AntiDupl.Net-05

7. 再看一次,這就是找到重複圖片之後的畫面,你可以用滑鼠雙擊圖片,它會用預設的圖片瀏覽器開啟。

上下圖片之間有個工具列,由左至右分別是「刪除上方那張」、「刪除下方那張」、「全都刪除」、「上方那張改成下方那張的名字」、「下方那張改成上方那張的名字」、「這是誤判」。前面我也提過了,程式會自動判斷哪張的品質比較糟,然後會自動建議你刪除比較糟的那張,它的建議值會用粉紅色當按鈕背景,例如現在它就建議我刪除上方那張 (左邊第一個按鈕)。

在右側則是找到的重複圖片列表,你可以點擊上方的 Difference 欄位,它就會依圖片差異度排序,差異愈小就代表愈相似,透過這樣的排序我們就可以知道哪些圖片最可能重複。你也可以點選多個項目,然後再按上方的按鈕,這樣就可以一次處理所有被你選起來的項目。

左邊數來第六個按鈕我們還沒介紹到,它是「使用程式的建議」。剛才我們有說過,程式會建議你刪除哪一張,當你按下這個按鈕,程式建議要刪除的圖片就會被丟到垃圾筒。

AntiDupl.Net-06

以上,就是它的基本用法,有很多圖片的人就趁這個機會整理一下吧 :D

Nelson 發表在 痞客邦 PIXNET 留言(6) 人氣()


留言列表 (6)

發表留言
  • MLChen
  • 有時候一些相片無 exif 結果又重複上傳,無法藉由相片拍攝日期來檢查重複的照片
    老大請問一下,您知道有檢查 flickr 重複上傳相片的服務嗎?
  • 這可能得 Flickr 自己提供了 Orz

    不然有個很笨的方法,你用工具把你的 Flickr 相片抓下來,然後再用工具去檢查,就知道有沒有重複了。只是自己上傳的照片,要自己再把它抓下來,真的挺笨的 XD

    Nelson 於 2009/06/11 13:11 回覆

  • sennac
  • 真的很方便
  • 路人甲
  • 比對的精準度應該是調整 check 設定裡的 "Threshold difference" 吧
    0%代表完全相似
  • 這個當然也有關係,我提到的那個也有關係,它的 help 這樣寫的 :D

    Nelson 於 2009/06/20 21:29 回覆

  • Marclen
  • 哇~~找了老半天,這軟體真的太棒了,功能又強大
    使用方便,而且還免費,感謝大大介紹!!
    差一點就要花錢買d'peg了說
  • SWN-002
  • 太讚了!!
    不過我還是會同時用Double Killer跟VisiPics三管齊下就是XD
  • YSW
  • 這是套很棒的軟體,感謝版主詳細的解說!!