现在要使用Pytorch中自带的
torch.nn.
CosineSimilarity函数计算两个高维特征图(B,C,H,W)中各个像素位置的特征相似度,即特征图中的每个像素位置上的一个(B,C,1,1)的向量为该位置的特征,总共有BxHxW个特征。
意思是 dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。但是现有的大多数博客将dim的用法复杂化,因此这里进行简单的实验验证,来验证一下上述说法。
1.计算高维数组中各个像素位置的余弦距离
创造高维数组,在通道维度(即dim=1)上进行向量的余弦距离计算,并查看其中第一批数据中的位置(0,0)上的两个向量之间的余弦距离:
>>> import torch>>> import torch.nn as nn>>> cos = nn.CosineSimilarity(dim=1, eps=1e-6)>>> input1 = torch.randn(3, 64, 100, 128)>>> input2 = torch.randn(3, 64, 100, 128)>>> output = cos(input1, input2)>>> output[0, 0, 0]tensor(-0.1095)
2.验证高维数组中任意一个像素位置的余弦距离
将上述高维数组中的第一批数据中的位置(0,0)上的各个通道数值组成该位置上的特征向量,并计算两个向量间的余弦距离:
>>> import torch>>> import torch.nn as nn>>> cos2 = nn.CosineSimilarity(dim=0, eps=1e-6)>>> input3=input1[0, :, 0, 0]>>> input4=input2[0, :, 0, 0]>>> output2 = cos2(input3, input4)>>> output2tensor(-0.1095)
发现两个距离是相同的,因此dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。
Pytorch中自带的torch.nn.CosineSimilarity函数计算两个高维特征图中各个像素位置的特征相似度,其中dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。
来源地址:https://blog.csdn.net/fx714848657/article/details/127384885