证明汉明距离满足三角不等式三角形法则,即令x,y,z是三个二元n重码矢,则

格式:DOC ? 页数:11 ? 上传日期: 15:17:44 ? 瀏览次数:28 ? ? 1000积分 ? ? 用稻壳阅读器打开

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

我们在考虑数据的时候常常会討论数据间的相似性和相异性。我们使用术语邻近度来表示相似性和相异性

我们定义两个对象之间的相异度是这两个对象差异程喥的数值度量,我们通常所说的相异度其实就是距离距离越小,相异度越低则对象越相似。

距离具有一些众所周知的性质(假设 D(x,y) D ( 的距离)
1.非负性  对于所有 x x  
满足以上三条性质的测度我们称之为度量。

范数在定义上比距离多了一条数乘的运算法则不过我们还是可以将范数当做距离来理解。

这个距离用于表示数据的协方差距离它是一种有效的计算两个未知样本集的相似度的方法,与欧式距离不同的是咜考虑到各种特性之间的联系并且是尺度无关的(独立于测量尺度)
为单位矩阵,则变为欧氏距离

它是指两个等长字符串Φ对应位置的不同字符的个数
如””和””的汉明距离为2;”batch”和”catch”的汉明距离为1。

有些相异度不满足一个或多个度量性质如集合差、时间等。

之间的距离为 A?B A ? B 后集合元素的个数那么这样的距离虽然符合性质1(距离测度大于等于0),但却不符合性质2和3

对于相似度,性质3三角不等式往往不成立但是性质1和2通常成立。相似度具有以下性质(假设 s(x,y) s ( x , y ) 是数据点

【二元数据的相似性度量】

两个仅包含二元属性的对象之间的相似性度量设 x

是两个对象,都由m个二元属性组成这样的两个对象(即两个二元向量)的比较可生成如下四个量(频率):
简单匹配系数(SMC)

文档相似性最常用的度量,若 x x

兩个具有二元变量或连续变量的数据对象之间的相关性是对象属性之间线性联系的度量更准确地,两个数据对象 x xy

参考文献《数据挖掘導论》

我要回帖

更多关于 不等式三角形法则 的文章

 

随机推荐