Java使用Tess4J实现图像识别方式-编程学习网

Java Tess4J实现图像识别

最近需要用Java做一个图像识别的东西，查了一些资料，在此写一个基于Tess4J的教程，方便其他人参考和使用。

其实做图像识别，也可以使用TESSERACT-OCR来实现，但是该方式需要下载软件，在电脑上安装环境，移植性不高，使用Tess4J只需要下载相关Jar包，导入项目，再把项目封装好就可以处处运行了。

首先，下载Tess4J的相关资源（一个压缩包）

官网：http://tess4j.sourceforge.net/codesample.html

解压，其中的目录结构如下：

需要用到其中圈起来的三个文件夹中的东西。lib文件夹下放的是需要用到的Jar包，tessdata下放的是语言库，默认的有英语库，中文库需要另外下载，下载地址：https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata。

新建一个Java项目，将lib文件夹和tessdata文件夹复制到项目的根目录下，找到dist文件夹下的tess4j.jar(名字可能有版本号)，将该文件也复制到项目根目录下的lib文件夹下。

项目的的目录如下

lib中的文件如下（tess4J.jar也在该目录下）

再在eclipse中打开项目

在项目中导入lib文件夹中所有的jar包（Build path --> configure build path）,导入后的结果如下：

这样前期准备工作就完成了，下面就剩下代码了。

Tess4J的代码比较简洁

如下：

Tess4JTest.java


package ocr; 
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import net.sourceforge.tess4j.util.LoadLibs; 
import java.io.File;
import java.io.IOException;
 

public class Tess4JTest { 
    public static void main(String[] args){ 
    	String path = "D://Java//Tess4J";//我的项目存放路径    	
    	File file = new File(path + "//photo.jpg");
        ITesseract instance = new Tesseract();
 
        
        File directory = new File(path);
        String courseFile = null;
        try {
            courseFile = directory.getCanonicalPath();
        } catch (IOException e) {
            e.printStackTrace();
        }
 
        //设置训练库的位置
        instance.setDatapath(courseFile + "//tessdata"); 
        instance.setLanguage("eng");//chi_sim ：简体中文， eng	根据需求选择语言库
        String result = null;
        try {
            long startTime = System.currentTimeMillis();
             result =  instance.doOCR(file);
            long endTime = System.currentTimeMillis();
            System.out.println("Time is：" + (endTime - startTime) + " 毫秒");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
        
        System.out.println("result: ");
        System.out.println(result);
    } 
}

这样就搞定了。

效果如下

原图：

读取结果：

从结果来看准确率还有待提高，l 和 1分不清，0 和 O 也没有分清，汉字的准确率还要低一些，大家可以自行训练字体库优化。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

文章详情

Java使用Tess4J实现图像识别方式

目录

Java Tess4J实现图像识别

首先，下载Tess4J的相关资源（一个压缩包）

项目的的目录如下

lib中的文件如下（tess4J.jar也在该目录下）

再在eclipse中打开项目

Tess4J的代码比较简洁

效果如下

软考中级精品资料免费领

相关文章

猜你喜欢

Java使用Tess4J实现图像识别方式

Java如何使用Tess4J实现图像识别

java使用tess4j进行图片文字识别功能

如何用Java实现图像识别和图像处理？

java怎么使用tess4j进行图片文字识别功能

如何使用Python实现图像识别？

如何在 Java 中巧妙运用 EasyOCR 实现图像识别？(如何在Java中使用EasyOCR进行图像识别)

如何使用Python实现图像文字识别OCR

如何使用Python实现识别图像中人物

如何用Java实现图像识别和目标跟踪？

怎么利用PyTorch实现图像识别

怎么使用Python+OpenCV实现图像识别替换功能

图文详解如何利用PyTorch实现图像识别

使用Go语言开发实现高性能的图像识别应用

如何使用Java开发二维码图像识别系统？

PHP使用PaddleOCR来实现图片识别

如何用Python实现图像文字识别OCR工具

如何利用Matlab仿真实现图像烟雾识别

Python实现图片滑动式验证识别方法

利用Matlab仿真实现图像烟雾识别(k-means聚类图像分割+LBP+PCA+SVM)