文通OCR文通数据录入工厂培训课件_第1页
文通OCR文通数据录入工厂培训课件_第2页
文通OCR文通数据录入工厂培训课件_第3页
文通OCR文通数据录入工厂培训课件_第4页
文通OCR文通数据录入工厂培训课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、TH-OCR 2019 文通数据录入工厂培训内容一、软件系统简介二、图像扫描简介三、操作流程四、详细操作五、纵向校对编辑器六、原式原样编辑器七、其他工具一、软件系统介绍1系统组成2技术性能3系统操作流程图4系统安装与卸载5系统配置及管理1、系统组成OCR 识别: 将图象文件进行识别,转化为电子文档。这是本系统的核心。高效校对: 利用横向校对及纵向校对手段对识别后所得的电子文档进行校对改错。版面还原: 将电子文档以用户所需的格式(HTML、PDF、JDA、RTF、XLS、TXT 等)导出在相应的应用软件中,可实现图文结合(TXT 格式除外),进行原式原样的编辑,并可调整、丰富版面信息,使生成最佳

2、的版面。辅助工具: 包括版面拼接及字符位置等工具。便于用户根据需要对所得电子文档进行编改。 2、技术性能 适用操作系统及运行环境 1)Windows 2000 和 Windows XP 等操作系统。2)网络环境。 识别字体 1)印刷体的文字,包括简(繁)体多体汉字、纯英文、日文、韩文、汉英混排文本。2)手写汉字。 使用内码 1)支持中文 GB、BIG5 及 GBK 内码;2)支持日文 JIS 及 Shift-JIS 内码;3)支持韩文 KSC 内码。对图象适应性 黑白二值、256 级灰度及 24 位彩色图象。 输出格式PDF、HTML、RTF、XLS 等标准格式3、流程图4、系统安装与卸载过程

3、略5、系统配置及管理该系统是基于网络环境下工作的系统,软件及随软件配置的加密锁应安装在与网络连接的同一台计算机上,并以该机作为“TH-OCR 2019 文通数据录入工厂”系统的主机,管理同网使用该系统的其它若干台计算机。如果由于特殊原因,需将软件安装在一台独立的(与其它计算机无网络联系的)计算机上时,必须保证该机装有网卡,且操作系统处于网络状态。 在启动本应用程序之前,必须保证正确的加密锁已连接在计算机上。当投入系统的机台数目已达到加密锁规定的用户数时,如其它的机台欲再加入本系统,将出现下列提示:“Too many users”当前的登陆请求超过了可同时运行应用程序的站点数,此时管理机应根据需

4、要对各机台是否进行工作进行调度。二、图像扫描规定1、准备工作2、扫描3、图片的命名规则4、图片处理1、准备工作准备要扫描的图书、期刊、论文等资料将准备好的资料编号,如00201扫描前的处理:拆分2、扫描两类扫描仪:高速扫描仪、平板扫描仪保存格式: 黑白图片保存成*.tif,彩色图保存成*.jpg。 封面文件和封底文件 封面文件必须,封底文件可有可无。3、图片的命名规则图书内容文件 格式:图书代码+序号,如00101001.tif封面和封底 格式:图书代码_fm.jpg或图书代码_fd.jpg目录文件 格式:图书目录_ml.txt4、图片处理对扫描后的图片进行处理去黑边纠偏去黑点三、ocr操作流

5、程1、系统设置2、新建工程,获取所要识别工程的图象3、图象版面处理4、识别及修改5、识别结果导出四、详细操作见说明书五、纵向校对编辑器横向校对传统的校错方法是人工逐字逐句比较识别结果与原始图象,找到错误的地方并修改。纵向校对相对于横向校对,按字校对。详细操作见说明书。六、原式原样编辑器JDAEdit 的功能是把 TH-OCR 2019 软件的识别结果原式原样地显示出来(以及对应的原始图象),便于用户对不满意的地方进行修改,最后生成通用格式的电子文档。 JDAEdit 的特点是能够准确重构原始图象,对于保持原样的报纸、书刊电子化极其有用。详细操作见说明书。七、其他工具1、 HTML 超文本文件编

6、辑器2、版面拼接3、字符位置4、TIFF2PDF 编辑器5、PDF2TIFF 文件编辑器2、版面拼接在很多的时候,用户需要扫描的文件往往过大,而不能一次扫描完全,需把文件分割成几部分来分别扫描,得到不同部分的扫描图档,传统的方法是单个识别再把识别后的不同的部分进行整合,拼成一个完整的文件。在 TH-OCR 2019 软件中提供了一个在识别前,把各个不同部分的扫描图档进行版面拼接的功能模块【版面拼接】操作见说明书。3、字符位置在 TH-OCR 2019 软件中新增了一个功能模块【字符位置】,如果用户不想使用 TH-OCR 2019软件的识别结果,【字符位置】功能模块提供了图象文件中每一字符的位置,以供用户使用。详见说明书。4、tiff2pdf工具在 TH-OCR 2019 增强版中有一项重要功能:TIFF 文件直接转换成 PDF 文件。它以最简洁的界面,最方便的操作,最直观的形式,满足了一部分用户想直接把扫描

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论