java代码相似性的算法 java相似的语言

分享Java常用几种加密算法

简单的Java加密算法有：

创新互联建站专注于和布克赛尔蒙古网站建设服务及定制，我们拥有丰富的企业做网站经验。热诚为您提供和布克赛尔蒙古营销型网站建设，和布克赛尔蒙古网站制作、和布克赛尔蒙古网页设计、和布克赛尔蒙古网站官网定制、小程序制作服务，打造和布克赛尔蒙古网络公司原创品牌,更为您提供和布克赛尔蒙古网站排名全网营销落地服务。

第一种. BASE

Base是网络上最常见的用于传输Bit字节代码的编码方式之一，大家可以查看RFC～RFC，上面有MIME的详细规范。Base编码可用于在HTTP环境下传递较长的标识信息。例如，在Java Persistence系统Hibernate中，就采用了Base来将一个较长的唯一标识符（一般为-bit的UUID）编码为一个字符串，用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中，也常常需要把二进制数据编码为适合放在URL（包括隐藏表单域）中的形式。此时，采用Base编码具有不可读性，即所编码的数据不会被人用肉眼所直接看到。

第二种. MD

MD即Message-Digest Algorithm （信息-摘要算法），用于确保信息传输完整一致。是计算机广泛使用的杂凑算法之一（又译摘要算法、哈希算法），主流编程语言普遍已有MD实现。将数据（如汉字）运算为另一固定长度值，是杂凑算法的基础原理，MD的前身有MD、MD和MD。广泛用于加密和解密技术，常用于文件校验。校验？不管文件多大，经过MD后都能生成唯一的MD值。好比现在的ISO校验，都是MD校验。怎么用？当然是把ISO经过MD后产生MD的值。一般下载linux-ISO的朋友都见过下载链接旁边放着MD的串。就是用来验证文件是否一致的。

MD算法具有以下特点：

压缩性：任意长度的数据，算出的MD值长度都是固定的。

容易计算：从原数据计算出MD值很容易。

抗修改性：对原数据进行任何改动，哪怕只修改个字节，所得到的MD值都有很大区别。

弱抗碰撞：已知原数据和其MD值，想找到一个具有相同MD值的数据（即伪造数据）是非常困难的。

强抗碰撞：想找到两个不同的数据，使它们具有相同的MD值，是非常困难的。

MD的作用是让大容量信息在用数字签名软件签署私人密钥前被”压缩”成一种保密的格式（就是把一个任意长度的字节串变换成一定长的十六进制数字串）。除了MD以外，其中比较有名的还有sha-、RIPEMD以及Haval等。

第三种.SHA

安全哈希算法（Secure Hash Algorithm）主要适用于数字签名标准（Digital Signature Standard DSS）里面定义的数字签名算法（Digital Signature Algorithm DSA）。对于长度小于^位的消息，SHA会产生一个位的消息摘要。该算法经过加密专家多年来的发展和改进已日益完善，并被广泛使用。该算法的思想是接收一段明文，然后以一种不可逆的方式将它转换成一段（通常更小）密文，也可以简单的理解为取一串输入码（称为预映射或信息），并把它们转化为长度较短、位数固定的输出序列即散列值（也称为信息摘要或信息认证代码）的过程。散列函数值可以说是对明文的一种“指纹”或是“摘要”所以对散列值的数字签名就可以视为对此明文的数字签名。

SHA-与MD的比较

因为二者均由MD导出，SHA-和MD彼此很相似。相应的，他们的强度和其他特性也是相似，但还有以下几点不同：

对强行攻击的安全性：最显著和最重要的区别是SHA-摘要比MD摘要长位。使用强行技术，产生任何一个报文使其摘要等于给定报摘要的难度对MD是^数量级的操作，而对SHA-则是^数量级的操作。这样，SHA-对强行攻击有更大的强度。

对密码分析的安全性：由于MD的设计，易受密码分析的攻击，SHA-显得不易受这样的攻击。

速度：在相同的硬件上，SHA-的运行速度比MD慢。

第四种.HMAC

HMAC(Hash Message Authentication Code，散列消息鉴别码，基于密钥的Hash算法的认证协议。消息鉴别码实现鉴别的原理是，用公开函数和密钥产生一个固定长度的值作为认证标识，用这个标识鉴别消息的完整性。使用一个密钥生成一个固定大小的小数据块，即MAC，并将其加入到消息中，然后传输。接收方利用与发送方共享的密钥进行鉴别认证等。

如何计算多个文本的相似度java程序，利用向量

String text1 = "我爱学习";

String text2 = "我爱读书";

String text3 = "他是黑客";

TextSimilarity textSimilarity = new CosineTextSimilarity();

double score1pk1 = textSimilarity.similarScore(text1, text1);

double score1pk2 = textSimilarity.similarScore(text1, text2);

double score1pk3 = textSimilarity.similarScore(text1, text3);

double score2pk2 = textSimilarity.similarScore(text2, text2);

double score2pk3 = textSimilarity.similarScore(text2, text3);

double score3pk3 = textSimilarity.similarScore(text3, text3);

System.out.println(text1+" 和 "+text1+" 的相似度分值："+score1pk1);

System.out.println(text1+" 和 "+text2+" 的相似度分值："+score1pk2);

System.out.println(text1+" 和 "+text3+" 的相似度分值："+score1pk3);

System.out.println(text2+" 和 "+text2+" 的相似度分值："+score2pk2);

System.out.println(text2+" 和 "+text3+" 的相似度分值："+score2pk3);

System.out.println(text3+" 和 "+text3+" 的相似度分值："+score3pk3);

运行结果如下：

我爱学习和我爱学习的相似度分值：1.0

我爱学习和我爱读书的相似度分值：0.4

我爱学习和他是黑客的相似度分值：0.0

我爱读书和我爱读书的相似度分值：1.0

我爱读书和他是黑客的相似度分值：0.0

他是黑客和他是黑客的相似度分值：1.0

方式二：简单共有词，通过计算两篇文档有多少个相同的词来评估他们的相似度

实现类：org.apdplat.word.analysis.SimpleTextSimilarity

用法如下：

String text1 = "我爱学习";

String text2 = "我爱读书";

String text3 = "他是黑客";

TextSimilarity textSimilarity = new SimpleTextSimilarity();

double score1pk1 = textSimilarity.similarScore(text1, text1);

double score1pk2 = textSimilarity.similarScore(text1, text2);

double score1pk3 = textSimilarity.similarScore(text1, text3);

double score2pk2 = textSimilarity.similarScore(text2, text2);

double score2pk3 = textSimilarity.similarScore(text2, text3);

double score3pk3 = textSimilarity.similarScore(text3, text3);

System.out.println(text1+" 和 "+text1+" 的相似度分值："+score1pk1);

System.out.println(text1+" 和 "+text2+" 的相似度分值："+score1pk2);

System.out.println(text1+" 和 "+text3+" 的相似度分值："+score1pk3);

System.out.println(text2+" 和 "+text2+" 的相似度分值："+score2pk2);

System.out.println(text2+" 和 "+text3+" 的相似度分值："+score2pk3);

System.out.println(text3+" 和 "+text3+" 的相似度分值："+score3pk3);

运行结果如下：

我爱学习和我爱学习的相似度分值：1.0

我爱学习和我爱读书的相似度分值：0.5

我爱学习和他是黑客的相似度分值：0.0

我爱读书和我爱读书的相似度分值：1.0

我爱读书和他是黑客的相似度分值：0.0

他是黑客和他是黑客的相似度分值：1.0

文本相似度算法-Jaro distance

给定两个文本串 , ,他们的Joro距离定义为：

求 match 的字符数：

分别来自 , 的字符，当他们相同或者距离小于 ,则被认为是 match 的。

比如： =“DIXON”, =“DICKSONX”

中的每一个字符都会与中距离内的字符进行比较。将所有 match 的字符串，需要替调换顺序才能匹配的总数除以二就是transpositions的大小。这里两个字符串中匹配的分别是："DION"，“DION",所以。

另外 =4, =8,

则：

参考：

分享文章：java代码相似性的算法 java相似的语言
分享路径：http://scyanting.com/article/doidoeh.html

java代码相似性的算法 java相似的语言

分享Java常用几种加密算法

如何计算多个文本的相似度java程序，利用向量

文本相似度算法-Jaro distance

其他资讯