文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

如何在Java项目中使用OCR tesseract实现一个图文识别功能

2023-05-31 11:24

关注

如何在Java项目中使用OCR tesseract实现一个图文识别功能?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

代码:

package com.zhy.test;  import java.io.BufferedReader;  import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List;  import org.jdesktop.swingx.util.OS;  public class OCRHelper {  private final String LANG_OPTION = "-l";  private final String EOL = System.getProperty("line.separator");    private String tessPath = new File("tesseract").getAbsolutePath();     public String recognizeText(File imageFile) throws Exception  {      File outputFile = new File(imageFile.getParentFile(), "output");    StringBuffer strB = new StringBuffer();   List<String> cmd = new ArrayList<String>();   if (OS.isWindowsXP())   {    cmd.add(tessPath + "\\tesseract");   } else if (OS.isLinux())   {    cmd.add("tesseract");   } else   {    cmd.add(tessPath + "\\tesseract");   }   cmd.add("");   cmd.add(outputFile.getName());   cmd.add(LANG_OPTION); //  cmd.add("chi_sim");   cmd.add("eng");    ProcessBuilder pb = new ProcessBuilder();      pb.directory(imageFile.getParentFile());   cmd.set(1, imageFile.getName());   pb.command(cmd);   pb.redirectErrorStream(true);   Process process = pb.start();   // tesseract.exe 1.jpg 1 -l chi_sim   // Runtime.getRuntime().exec("tesseract.exe 1.jpg 1 -l chi_sim");    //  System.out.println(cmd.toString());   int w = process.waitFor();   if (w == 0)// 0代表正常退出   {    BufferedReader in = new BufferedReader(new InputStreamReader(      new FileInputStream(outputFile.getAbsolutePath() + ".txt"),      "UTF-8"));    String str;     while ((str = in.readLine()) != null)    {     strB.append(str).append(EOL);    }    in.close();   } else   {    String msg;    switch (w)    {    case 1:     msg = "Errors accessing files. There may be spaces in your image's filename.";     break;    case 29:     msg = "Cannot recognize the image or its selected region.";     break;    case 31:     msg = "Unsupported image format.";     break;    default:     msg = "Errors occurred.";    }    throw new RuntimeException(msg);   }   new File(outputFile.getAbsolutePath() + ".txt").delete();   return strB.toString().replaceAll("\\s*", "");  } } 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 资料下载
  • 历年真题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯