博客 / 列表

nick_63c3c5cf4b3ee - 模糊哈希(fuzzy hash)對比文件相似度

對比兩個文件相似度,python中可通過difflib.SequenceMatcher/ssdeep/python_mmdt/tlsh實現, 在大量需要對比,且文件較大時,需要更高的效率,可以考慮模糊哈希(fuzzy hash),如ssdeep/python_mmdt 測試過程發現: difflib方法,讀取文件後,可以實現匹配度輸出 ssdeep/mmdt/tlsh方法可以實現,實現

hash , Python