Skip to content

Latest commit

 

History

History
45 lines (31 loc) · 2.58 KB

Similarity Measurement_.md

File metadata and controls

45 lines (31 loc) · 2.58 KB

估算不同样本之间的相似性度量(Similarity Measurement)

1. Euclidean Distance(欧氏距离)

2. Manhattan/City Block Distance(曼哈顿距离)

3. Chebyshev Distance(切比雪夫距离)

4. Minkowski Distance(闵可夫斯基距离)

  • p=1,Manhattan;p=2,Euclidean;p=,Chebyshev;

5. Standardized Euclidean distance(标准化欧氏距离)

6. Mahalanobis Distance(马氏距离)

  • S为协方差矩阵,为均值

7. Cosine(夹角余弦)

  • 余弦取值范围为[-1,1]

8. Hamming distance(汉明距离)

  • 两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数

9. Jaccard similarity coefficient(杰卡德距离 & 杰卡德相似系数)

  • 杰卡德距离用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度,用在衡量样本的相似度上

10. Pelson Correlation coefficient(皮尔逊相关系数 & 相关距离)

11. Information Entropy信息熵