Java实现余弦匹配算法
最近在做一个通讯交友的项目,项目中有一个这样的需求,通过用户的兴趣爱好,为用户寻找推荐兴趣相近的好友。其实思路好简单,把用户的兴趣爱好和其他用户的兴趣爱好进行一个匹配,当他们的爱好相似度比较高的时候就给双方进行推荐。那么如何进行比较是一个问题,其实我们可以通过余弦匹配算法来对用户的兴趣爱好进行比较,根据计算出来的值来得到一个兴趣爱好相近好友列表,并进行排序。
因为我做的项目是Android端的,所以算法是通过Java实现的,废话不过多说了,下面是算法的实现:
package com;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
public class SimilarDegreeByCos {
public static double getSimilarDegree(String str1, String str2)
{
//创建向量空间模型,使用map实现,主键为词项,值为长度为2的数组,存放着对应词项在字符串中的出现次数
Map<String, int[]> vectorSpace = new HashMap<String, int[]>();
int[] itemCountArray = null;//为了避免频繁产生局部变量,所以将itemCountArray声明在此
//以空格为分隔符,分解字符串
String strArray[] = str1.split(" ");
for(int i=0; i<strArray.length; ++i)
{
if(vectorSpace.containsKey(strArray[i]))
++(vectorSpace.get(strArray[i])[0]);
else
{
itemCountArray = new int[2];
itemCountArray[0] = 1;
itemCountArray[1] = 0;
vectorSpace.put(strArray[i], itemCountArray);
}
}
strArray = str2.split(" ");
for(int i=0; i<strArray.length; ++i)
{
if(vectorSpace.containsKey(strArray[i]))
++(vectorSpace.get(strArray[i])[1]);
else
{
itemCountArray = new int[2];
itemCountArray[0] = 0;
itemCountArray[1] = 1;
vectorSpace.put(strArray[i], itemCountArray);
}
}
//计算相似度
double vector1Modulo = 0.00;//向量1的模
double vector2Modulo = 0.00;//向量2的模
double vectorProduct = 0.00; //向量积
Iterator iter = vectorSpace.entrySet().iterator();
while(iter.hasNext())
{
Map.Entry entry = (Map.Entry)iter.next();
itemCountArray = (int[])entry.getValue();
vector1Modulo += itemCountArray[0]*itemCountArray[0];
vector2Modulo += itemCountArray[1]*itemCountArray[1];
vectorProduct += itemCountArray[0]*itemCountArray[1];
}
vector1Modulo = Math.sqrt(vector1Modulo);
vector2Modulo = Math.sqrt(vector2Modulo);
//返回相似度
return (vectorProduct/(vector1Modulo*vector2Modulo));
}
public static void main(String args[])
{
String str1 = "阳光活泼 跑步 羽毛球";
String str2 = "爱美食 跑步 篮球 足球 冰棒球 骑马 游泳";
String str3 = "90后 动漫 旅游 爱美女";
String str4 = "阳光活泼 爱游戏 爱代码 码农";
String str5 = "羽毛球 羽毛球 羽毛球 羽毛球";
String str6 = "阳光活泼 跑步 羽毛球";
System.out.println("str1和str2相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str2));
System.out.println("str1和str3相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str3));
System.out.println("str1和str4相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str4));
System.out.println("str1和str5相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str5));
System.out.println("str1和str6相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str6));
}
}
效果:
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
您可能感兴趣的文章:Java数据结构之稀疏矩阵定义与用法示例Java基于余弦方法实现的计算相似度算法示例JAVA实现基于皮尔逊相关系数的相似度详解java字符串相似度算法Java实现的求逆矩阵算法示例java实现任意矩阵Strassen算法Java矩阵连乘问题(动态规划)算法实例分析Java实现输出回环数(螺旋矩阵)的方法示例java实现的n*n矩阵求值及求逆矩阵算法示例Java编程实现邻接矩阵表示稠密图代码示例Java实现的计算稀疏矩阵余弦相似度示例