今天小编给大家分享一下java文件合并与修改md5值的问题怎么解决的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
文本文件合并
运行效果:
运行前:在这个路径下面有9个文件。
运行后:产生了一个 merge.txt 文件
文件内容展示
代码部分
这部分代码,功能很简单就是把一个个的文本文件合并后写入一个总的 merge.txt 文件夹,当时学会了往文件里追加内容,所以写了这个 demo。
简单来说就是获取每一个文件(文本文件,我进行了过滤。)得到一个输入流,然后一个循环内,每次将一个文件的信息写入合并的文件内,循环结束,文件合并就完成了。
package com.filemerge;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.io.OutputStreamWriter;public class FileMerge {//参数为一个文件夹路径public static void fileMerge(String path){File target = new File(path); //待合并文件夹目录File output = new File(path+File.separator+"merge.txt"); //合并文件夹位置String[] names = target.list((dir,name)->name.contains(".txt")); //过滤非文本文件,返回值为一个 String 数组BufferedReader reader = null;BufferedWriter writer = null;//OutputStreamWriter 不要记错了!try {writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(output,true)));for (String name : names) {reader = new BufferedReader(new InputStreamReader(new FileInputStream(target+File.separator+name)));String line = null;while((line = reader.readLine()) != null) {writer.write(line);writer.newLine();}writer.newLine(); //每个文件进行换行分隔内容!}System.out.println("File merge successfully!");} catch (FileNotFoundException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} finally {try {reader.close();writer.close();} catch (IOException e) {e.printStackTrace();}}}}
测试代码:
package com.filemerge;public class Test {public static void main(String[] args) {FileMerge.fileMerge("D:/DB/DreamDragon");}}
图片文件合并(重点)
如果看完了上面的文本文件合并的话,不妨再多看一点,把下面这个图片文件的代码也看了吧,如果有什么错误,欢迎指出来。(还有关于图片的一些知识,不知道谁能指出来一下。)
代码如下:合并图片工具类
package dragon;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedWriter;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.OutputStreamWriter;public class ImageMerge {//图片合并路径,将要合并图片放入同一个文件夹方便操作public static final String mergePath = "D:/DragonDataFile/beauty"; public static final String outputPath = "D:/DragonDataFile/merge";//工具类,就只是用静态方法了,不要创建对象了。private ImageMerge() {}public static void imageMerge() throws IOException {File mergeFile = new File(ImageMerge.mergePath);File outputFile = new File(ImageMerge.outputPath);if (!initPath(mergeFile, outputFile)) { // 无法创建 mergePaththrow new FileNotFoundException("无法创建文件夹: "+ImageMerge.mergePath);}try (//创建输出文件BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(new File(outputFile, System.currentTimeMillis()+".jpeg")))){File[] files = mergeFile.listFiles();recordImageInfo(files, outputFile); //记录文件信息,保存于图片的文件夹下,可能更好点。for (File file : files) {try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(file))){int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b, 0, hasRead);}}}}}//初始化路径,如果 mergePath 不存在private static boolean initPath(File mergeFile, File outputFile) {boolean mk_mergeFile = false, mk_outputFile = false;if (!mergeFile.exists()) { // mergePath 不存在mk_mergeFile = mergeFile.mkdirs(); } else {mk_mergeFile = true;}if (!outputFile.exists()) {mk_outputFile = outputFile.mkdirs();} else {mk_outputFile = true;}return mk_mergeFile && mk_outputFile;}//记录信息private static void recordImageInfo(File[] files, File outputFile) throws FileNotFoundException, IOException {try (BufferedWriter bos = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(new File(outputFile,"mergeImageInfo.txt"), true)))){for (File file : files) { String record = file.length()+" ";bos.write(record);bos.newLine();}}}}
图片分隔工具类
package dragon;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.util.LinkedList;import java.util.List;import java.util.UUID;public class ImageSeparate {//拆分文件的位置private static final String separatePath = "D:/DragonDataFile/separate";private ImageSeparate() {}public static void imageSeparate() throws IOException {File separateFile = new File(ImageSeparate.separatePath);if (initPath(separateFile)) { //无法创建文件夹throw new FileNotFoundException("无法创建文件夹: "+ImageSeparate.separatePath);}File outputFile = new File(ImageMerge.outputPath);//下面获取的都是 String 数组,但是正常情况下应该都是只有一个 String 的字符串//获取图片文件信息文件File[] infoFile = outputFile.listFiles(f->f.getName().contains(".txt"));//获取合并图片文件File[] mergeFile = outputFile.listFiles(f->!f.getName().contains(".txt"));// 获取信息文件信息(图片的长度)List<Long> fileInfo = getFileInfo(infoFile[0]);try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(mergeFile[0]))){fileInfo.stream().forEach(len->{String filename = System.currentTimeMillis()+UUID.randomUUID().toString()+".jpeg";System.out.println(filename);try (BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(new File(separateFile, filename)))){long record = 0;int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b,0,hasRead);//先判断,再读取数据,否则会出错。record += (long)hasRead;if (len-record < 1024) {long tail = len-record;bis.read(new byte[(int)tail]);bos.write(b, 0, (int)tail);break;}}} catch (IOException e) {e.printStackTrace();}});}}//获取信息文件信息(图片的长度)private static List<Long> getFileInfo(File file) throws NumberFormatException, IOException{List<Long> fileInfo = new LinkedList<>();try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file)))){String line = null;while ((line = br.readLine()) != null) {//将数据转换为 long 再存入集合,或许使用 DataInputStream 更好吧//注意,如果这个文件里面被修改了,可能会引发 RuntimeExceptionString[] str = line.split(" ");fileInfo.add(Long.parseLong(str[0]));System.out.println(line);}}return fileInfo;}//初始化 拆分文件位置private static boolean initPath(File file) {return file.mkdirs();}}
测试类
package dragon;import java.io.IOException;public class Client {public static void main(String[] args) throws IOException, NumberFormatException, ClassNotFoundException {//如果需要合并图片,就使用第一条语句,注释第二条,//如果需要拆分图片,就使用第二条语句,注释第一条ImageMerge.imageMerge();//ImageSeparate.imageSeparate();}}
说明:
每一个类都含有很多注释 ,应该还是能表达清楚意思的,有几点需要说明一下。
运行效果:
测试准备图片: 注意观察文件夹的路径和第一张图片。
测试准备图片信息: 注意观察文件的大小和占用空间信息。
合并效果: 注意观察合并后的图片和合并文件的路径。
合并后的文件会产生一个单独的文本文件,这里面存储的是图片的大小信息,因为恢复图片,是需要这些信息的,否则图片可能就回不来了。
注意:我当时看到这个结果,感觉很奇妙,虽然合并了37张图片,但是它居然还可以正常显示第一张图片的信息,这个可能和图片本身的存储形式有关(我没有这方面的知识)。
文本文件信息截图:
注:我是以行为单位进行存储的,每行一个数据,读取也是这样的,这样感觉比较方便。千万不能修改这个文件的任何信息,否则就无法恢复图片的信息了。
恢复图片: 注意观察右下角那张图片,因为我没有保留文件名,所以生成图片的文件名是重写生成的,还有注意到了我的文件名比较长,这个可以参考我开头的那个博客链接,这里是使用当前日期的毫秒数+UUID来生成的图片名,确实是比较长了,但是不会重复,这是我需要的。
控制台输入信息:
我会把读取的图片信息(每张图片的大小数据)和恢复图片时生成的图片文件名打印出来,这样调试比较方便,看起来也很好看,哈!
一些细节
图片的合并就是单纯的文件合并,只是获取每一个文件的输入流,然后将其依次写入一个输出流中。(这里使用的是字节流,图片可不能使用字符流!)
for (File file : files) {try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(file))){int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b, 0, hasRead);}}}
这里比较难得是如何从一个整的合并图片中恢复所有图片的信息,因为图片的特殊存储格式,如果在图片的头部产生错误,就无法识别了(我只知道图片头部含有一个魔数,用于标识图片,其他的不是很清楚,我没有这图像方面的知识,如果有人知道,可以在下面评论。),一个字节也不行!
我来说一说我的想法:
举个例子,干巴巴的说着估计很难讲的明白。
先看下面这张图片,假定这是(合并后图片中)某个图片 的信息,我们需要在一个完整的输入流中,完整的取出来这一部分,不能多也不能少! 注意是顺序读取数据。再强调一下,这是中间某一张图片,也就是这个图表示某一个图片的数据,但是不是整个文件的数据,也就是说,这个图片下面还有数据,最下面那个小于 1024 byte,只是表示这张图片还剩下少于 1024 byte得数据。
所以下面这种读取方式是错误的,无法正确的恢复图片。
byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b, 0, hasRead);}
其实有一种很简单的方式,就是下面注释中的方式,每次直接将整个图片的数据读取出来,写入一个输出流,就是一张完整得图片了,简单粗暴,但是我考虑到,有时候图片太大,对于内存是一个很大的消耗,没有采用这种方式。
仍然采用逐次读取的方式:
说明:
设置一个字节计数器,在每次读取(1024byte)之后,下一次读取之前,判断当前图片的大小和当前读入的字节数的差值是否大于 1024 字节,即是否满足一次完整的读取,如果满足的条件,就继续读取写入操作,如果不足 1024字节,说明不能再进行读取写入了(因为当前图片下面还有其它图片数据,所以仍然是可以读取 1024 字节的,只是属于当前图片的字节数,不足 1024 字节了,即不能进行一次完整的读取了。)所以,如果不足以进行一次完整的读取,那就只读当前还需要的字节,只需要读取一次就行了,读取之后将数据写入输出流,退出当前循环,进行下一张图片的读取。 可以画图观察一下,就会理解了。
try (BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(new File(separateFile, filename)))){long record = 0;int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b,0,hasRead);//先判断,再读取数据,否则会出错。record += (long)hasRead;if (len-record < 1024) {long tail = len-record;bis.read(new byte[(int)tail]);bos.write(b, 0, (int)tail);break;}}} catch (IOException e) {e.printStackTrace();}
不足之处
如果仔细阅读了我的代码,应该可以看出来了,有一些地方写的不好。
主要有以下几点:
没有保存图片的类型,恢复图片时,只能强行指定文件的后缀名为 jpeg,这样做不是很好的做法。
恢复图片时,直接指定为jpeg,不太合适。
String filename = System.currentTimeMillis()+UUID.randomUUID().toString()+".jpeg";
这个是创建合并文件时,指定第一张图片的后缀名,这样做也不是很好。
new File(outputFile, System.currentTimeMillis()+".jpeg")
所以我对上面代码进行了改进,在保存图片的大小信息的同时,保存图片的后缀名信息(一般都是有的,但是如果没有的话,我就指定一个 “.none” 作为后缀名了)。一开始我是准备还是直接按照如下形式存储:
图片大小 [空格分隔] 图片后缀名
但是实际处理过程中,这样感觉还是比较麻烦的,因为存储的数据都是字符信息了,Java是没有办法直接使用的,显示转换太麻烦了,所以我决定不使用这种方式了,转而使用Java的对象序列化。因为同时需要大小和后缀名两个属性,而且两个属性之间也是具有很强关系的(一对一),干脆封装一下,做成一个Java类,这样使用起来很方便,而且两个属性之间也建立了联系,序列化恢复也比较方便。而且对象序列化还带来一个好处,Java的对象序列化是二进制序列化,区别于 json 这种字符序列化,二进制是机器读取的,我们就算打开了也是乱码,所以,可以避免这个文件被别人给修改了。(一般是不会去修改二进制文件的吧,哈!)
图片对象模型
package dragon;import java.io.Serializable;public class FileInfo implements Serializable{private static final long serialVersionUID = 1L;private long len;private String suffix;public FileInfo(long len, String suffix) {this.len = len;this.suffix = suffix;}public long getLen() {return this.len;}public String getSuffix() {return this.suffix;} //重写 toString 方法,方便打印调试代码@Overridepublic String toString() {return "FileInfo [len=" + len + ", suffix=" + suffix + "]";}}
对于原来的图片合并和分隔方法,都进行了一点改进,所以命名规则上都在原来的类前面加了一个 Enhance (增强、改进)。
改进的图片合并类:EnhanceImageMerge
package dragon;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.ObjectOutputStream;import java.util.LinkedList;import java.util.List;public class EnhanceImageMerge {//图片合并路径,将要合并图片放入同一个文件夹方便操作public static final String mergePath = "D:/DragonDataFile/beauty"; public static final String outputPath = "D:/DragonDataFile/merge";//工具类,就只是用静态方法了,不要创建对象了。private EnhanceImageMerge() {}public static void imageMerge() throws IOException {File mergeFile = new File(EnhanceImageMerge.mergePath);File outputFile = new File(EnhanceImageMerge.outputPath);if (!initPath(mergeFile, outputFile)) { // 无法创建 mergePaththrow new FileNotFoundException("无法创建文件夹: "+EnhanceImageMerge.mergePath);}File[] files = mergeFile.listFiles();String suffix = recordImageInfo(files, outputFile); //记录文件信息,保存于图片的文件夹下,可能更好点。try (//创建输出文件BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(new File(outputFile, System.currentTimeMillis()+suffix)))){for (File file : files) {try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(file))){int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b, 0, hasRead);}}}}}//初始化路径,如果 mergePath 不存在private static boolean initPath(File mergeFile, File outputFile) {boolean mk_mergeFile = false, mk_outputFile = false;if (!mergeFile.exists()) { // mergePath 不存在mk_mergeFile = mergeFile.mkdirs(); } else {mk_mergeFile = true;}if (!outputFile.exists()) {mk_outputFile = outputFile.mkdirs();} else {mk_outputFile = true;}return mk_mergeFile && mk_outputFile;}使用对象序列化进行数据的存储,方便快捷。private static String recordImageInfo(File[] files, File outputFile) throws FileNotFoundException, IOException {try ( //二进制保存的数据,无法直接阅读,不加扩展名了 ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream(new File(outputFile, "fileinfo"), true))){List<FileInfo> fileInfos = new LinkedList<>(); for (File file : files) {String filename = file.getName(); //记录文件的大小和扩展名信息 如果没有的话,默认设置为 none。long len = file.length(); String suffix = filename.lastIndexOf(".") != -1 ? filename.substring(filename.lastIndexOf(".")) : ".none";FileInfo fileInfo = new FileInfo(len, suffix);System.out.println(fileInfo.toString());fileInfos.add(fileInfo);}oos.writeObject(fileInfos); //直接将集合序列化,序列化单个对象,读取的时候太麻烦了}String firstFileName = files[0].getName();//返回第一个文件的后缀名。return firstFileName.lastIndexOf(".") != -1 ? firstFileName.substring(firstFileName.lastIndexOf(".")) : ".none";}}
注意:对象序列化的时候,如果每次序列化一个对象的话,那么读取的时候,就无法判断怎么结束了,因为程序不知道该读取多少次才结束,而且似乎不能使用读取结果为 null 来判断,那样会引发一个 EOFException。
我去查阅资料,有人推荐了,在序列化的最后,添加一个 null 对象,这确实是一个很好的方法,但是感觉还是不好。
另一种方式就是直接序列化一个List 集合,这样确实是方便多了,存入一个集合,读取回来了还是一个集合,可以直接操作了,还省去将对象再组装成集合的时间。(对象序列化,我只是了解,用过那么一两次,不是很熟。)
对象序列化部分
使用对象序列化进行数据的存储,方便快捷。private static String recordImageInfo(File[] files, File outputFile) throws FileNotFoundException, IOException {try ( //二进制保存的数据,无法直接阅读,不加扩展名了 ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream(new File(outputFile, "fileinfo"), true))){List<FileInfo> fileInfos = new LinkedList<>(); for (File file : files) {String filename = file.getName(); //记录文件的大小和扩展名信息 如果没有的话,默认设置为 none。long len = file.length(); String suffix = filename.lastIndexOf(".") != -1 ? filename.substring(filename.lastIndexOf(".")) : ".none";FileInfo fileInfo = new FileInfo(len, suffix);System.out.println(fileInfo.toString());fileInfos.add(fileInfo);}oos.writeObject(fileInfos); //直接将集合序列化,序列化单个对象,读取的时候太麻烦了}String firstFileName = files[0].getName();//返回第一个文件的后缀名。return firstFileName.lastIndexOf(".") != -1 ? firstFileName.substring(firstFileName.lastIndexOf(".")) : ".none";}
改进的图片分隔类:EnhanceImageSeparate
package dragon;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.ObjectInputStream;import java.util.List;import java.util.UUID;public class EnhanceImageSeparate {//拆分文件的位置private static final String separatePath = "D:/DragonDataFile/separate";private EnhanceImageSeparate() {}public static void imageSeparate() throws IOException, NumberFormatException, ClassNotFoundException {File separateFile = new File(EnhanceImageSeparate.separatePath);if (initPath(separateFile)) { //无法创建文件夹throw new FileNotFoundException("无法创建文件夹: "+EnhanceImageSeparate.separatePath);}File outputFile = new File(ImageMerge.outputPath);//下面获取的都是 String 数组,但是正常情况下应该都是只有一个 String 的字符串//获取图片文件信息文件File[] infoFile = outputFile.listFiles(f->!f.getName().contains(".")); //序列化文件是没有后缀名的//获取合并图片文件File[] mergeFile = outputFile.listFiles(f->f.getName().contains(".")); //图片文件都是有后缀名的// 获取信息文件信息(图片的长度)System.out.println(infoFile[0]);List<FileInfo> fileInfos = getFileInfo(infoFile[0]);mergeOperation(fileInfos, mergeFile[0], separateFile);}private static void mergeOperation(List<FileInfo> fileInfos, File mergeFile, File separateFile) throws FileNotFoundException, IOException {try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream(mergeFile))){fileInfos.stream().forEach(fileInfo->{long len = fileInfo.getLen();String filename = System.currentTimeMillis()+UUID.randomUUID().toString()+fileInfo.getSuffix();System.out.println(filename);try (BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(new File(separateFile, filename)))){long record = 0;int hasRead = 0;byte[] b = new byte[1024];while ((hasRead = bis.read(b)) != -1) {bos.write(b,0,hasRead);//先判断,再读取数据,否则会出错。record += (long)hasRead;if (len-record < 1024) {long tail = len-record;bis.read(new byte[(int)tail]);bos.write(b, 0, (int)tail);break;}}} catch (IOException e) {e.printStackTrace();}});}}//获取信息文件信息(图片的长度)//抑制一下 unchecked 警告@SuppressWarnings("unchecked")private static List<FileInfo> getFileInfo(File file) throws NumberFormatException, IOException, ClassNotFoundException{try (ObjectInputStream ois = new ObjectInputStream(new FileInputStream(file))){return (List<FileInfo>) ois.readObject(); //强制类型转换一下,读取出来的数据都是 Object 类型}}//初始化 拆分文件位置private static boolean initPath(File file) {return file.mkdirs();}}
注意: 分隔还原图片时,图片的后缀名部分代码为:
使用Java封装属性后,使用很方便了。
String filename = System.currentTimeMillis()+UUID.randomUUID().toString()+fileInfo.getSuffix();
反序列化读取集合:
这里我抑制了一个强制类型转换的警告。
通过序列化,可以发现代码量大大减少了,直接就是集合,使用非常方便。
//抑制一下 unchecked 警告@SuppressWarnings("unchecked")private static List<FileInfo> getFileInfo(File file) throws NumberFormatException, IOException, ClassNotFoundException{try (ObjectInputStream ois = new ObjectInputStream(new FileInputStream(file))){return (List<FileInfo>) ois.readObject(); //强制类型转换一下,读取出来的数据都是 Object 类型}}
测试代码
package dragon;import java.io.IOException;public class Client {public static void main(String[] args) throws IOException, NumberFormatException, ClassNotFoundException {//如果需要合并图片,就使用第一条语句,注释第二条,//如果需要拆分图片,就使用第二条语句,注释第一条 EnhanceImageMerge.imageMerge();// EnhanceImageSeparate.imageSeparate();}}
改进后代码运行结果 执行合并方法时,打印的图片对象模型的信息
合并后的效果
注意观察右边的 fileinfo 文件,因为是二进制数据,我就没有给它加上文件后缀名,加上了也是无法直接阅读的,里面存储的是图片对象模型集合的序列化信息。
执行分隔操作后的效果
控制台输出图片信息,可以看到每个图片的后缀名都恢复了,注意看最后一个,有一个文本文件!哈哈!这个图片后面似乎可以添加任何数据,也许视频也是可以的,只是我没有测试,这个应该和图片的存储格式、显示方式有关。
注意,下面恢复的时候,确实是有一个文本文件,并且是完好的,可以阅读的。
合并后被分隔出的文本文件的信息
以上就是“java文件合并与修改md5值的问题怎么解决”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网行业资讯频道。