为何您需要的是FlexiCapture技术

“ABBYY FlexiCapture”一词随上下文代表不同的含义:

  • 作为一条专业应用程序产品线的名称(分为独立式、分布式):完成表格处理、文档分类、数据捕捉方面的任务,输出结构化的信息,供后端业务流程使用。
    关于 FlexiCapture产品和解决方案的更多信息可详见English, 中文
  • FlexiCapture Engine 作为一款软件开发工具包,为开发者提供核心引擎技术
  • FlexiLayouts 与FlexiLayout Studio则是实现文档定义和数据提取逻辑开发和定义的技术的核心。

以下简要介绍通过自定义规则从原始文本中提取数据FlexiLayout 技术两者之间的根本差别。

为何您需要的是FlexiCapture技术

ABBYY FineReader Engine是一款全文本OCR SDK,可以帮助您识别文件页面中的所有信息。如果您需要对书籍、协议、说明书或其它“纯文本”文件的整个页面进行识别,那ABBYY FineReader Engine非常有用。但是对于一份结构化文件,页面布局包含有非常有价值的信息,不仅仅是徽标、图像及文字区域,还包括行及不同元素之间的间距,正是这些在文档中创建了内容结构。ABBYY FineReader Engine 中采用的ABBYY OCR技术能够分析PDF及图像页面布局。开发人员可以读取页面布局结构及某些区域的坐标:

  • 文本
  • 图像
  • 条形码
  • 表格
  • 可以通过以下途径读取信息:
  • 通过FineReader Engine布局对象——文件处理过程中“在线”(“on-line”)读取

  • 通过ABBYY XML ——“离线”(“offline”)读取并解析信息

但是ABBYY FlexiCapture平台具有更加高级的功能实现该目标

  • 在FineReader Engine中编写“硬编码”(hard coded)提取逻辑比较复杂,而且编写的代码不易维护
    • → FlexiCapture Technology是一种产品化技术,需要培训及支持
    • → 市场上有经认证的专业人士
  • 在纯代码中处理文本及布局相当抽象,而且在FineReader SDK中没有任何可选工具
    • → 而FlexiCapture具有以下特点:
      • 可视化开发工具
      • 处理图形元素的逻辑
      • 使用对象间关系的逻辑
      • 自动假设检验分析——也允许可选元素

以下简要介绍它们在文件分析方面的区别:

更多优势

FlexiCapture技术还可提供:

  • 支持多页文档
  • 包含重复元素的复杂文档结构,例如:保险合同中包含为每一位家庭成员在一套标准页面中嵌入的表格
  • 支持通过脚本定义任何你需要的内容

利用Flexible在移动设备提取数据

  • 使用移动设备提取数据并非易事,因为:
    • 图像质量通常比不上扫描文件
    • 移动设备OCR SDK的布局分析能力不同于“大型” PC/Server SDK
    • 扫描仪具有固定几何结构
      • 因此同一类文件上的信息具有差不多相同的坐标。
      • 如果使用照相机捕捉文件,文件与传感器之间的距离几乎都不相同。
      • 这将导致不同的复制比例,因此信息将位于不同的坐标 → 简单的坐标查找方法不再适用。
  • FlexiLayout并未采用绝对性坐标群集,因此也可以处理移动图像。

有任何问题?请联系ABBYY经理

最新文章

This website uses cookies which enable you to see pages or use other functions of our websites. You can turn off such cookies in your browser’s settings. If you continue to use these pages, you consent to the use of cookies.