互亿无线 · 文档中心

OCR识别 - 常见问题


Q1:什么是OCR?
OCR(Optical Character Recognition),即光学字符识别,是一项先进技术。它通过扫描等光学手段,将各类票据、报刊、书籍、文稿以及其他印刷品中的文字转换为图像信息。随后,利用文字识别技术,这些图像信息被转化为可以电子化处理的格式,方便计算机输入和使用。

Q2:文字识别功能能识别哪些内容?
基于深度学习技术的文字识别(OCR)可以智能地将图片中的文字内容转换为可编辑的文本格式。此技术支持多种场景下的通用文字、卡证文字、票据单据等印刷体和手写体文字的识别。此外,它还包括票据核验功能,有效替代传统的人工录入方式,极大提升工作效率。

Q3:接入文字识别OCR服务,需要开发编程能力吗?
接入文字识别OCR服务需要一定的编程开发能力。用户需进行二次开发对接,并通过调用API接口,实现从图片或扫描件中提取文字并转换为可编辑文本的功能。识别提取后的结果需通过编程技术与用户的业务系统相结合,或保存为TXT、Excel等文件格式。

Q4:我购买了通用印刷体识别资源包,各版本接口都可以使用吗?
不可以。通用印刷体识别、通用印刷体识别(高速版)和通用印刷体识别(高精度版)是三个独立的接口,各自的资源包不能混用。若您购买的是通用印刷体识别资源包,则仅限于该接口的使用。

Q5:文字识别OCR有哪些应用场景?
OCR技术广泛应用于多个领域:它能自动识别图片或视频帧中的关键文字信息,使信息搜索与审核更加迅速和精准,极大地提升信息分发与管理水平。同时,OCR技术还可用于文档电子化,如办公文件、合同文档、法律卷宗等,通过识别这些纸质文档中的文字信息,便于文件的保存、分类和检索。

Q6:怎么提高识别的准确率和识别速度?
提高文字识别的准确率和速度,需注意以下几点:确保拍摄光照、背景和清晰度适宜。建议上传JPG格式的图片,且文件大小不超过1M。在采集图片时,尽可能放大要识别的文字区域,保证文字清晰可辨。适当压缩图片大小,也能有效缩短识别时间。

Q7:文字识别是否支持方向旋转/不同朝向的图片文字识别?
大多数文字识别能力已经支持图像方向的自动校正,可以正确识别旋转的图片中的文字。

Q8:文字识别是否可以批量识别?
目前,文字识别技术不支持批量识别。每次调用只能识别单张图片,但您可以在QPS允许的范围内进行多线程调用。

Q9:可以识别PDF、Word、Excel等格式文件吗?
目前支持JPG、JPEG、BMP、TIF、WebP等图片格式及PDF文档的识别,但暂不支持Word、Excel等格式。如需识别这些格式的文本,可先将其转换为图片或PDF格式后再进行上传。

Q10:为什么文字识别结果不准确?
文字识别结果不准确可能有多种原因:图片尺寸过小,低于15px;图片画质差,如过暗、内容不清晰;文字内容被水印、印章或褶皱等遮挡;图片样式与接口支持类型不符,如身份证识别仅支持二代居民身份证。如遇错误码,请参考相应的错误码进行问题排查。

Q11:身份证OCR是如何收费的?
身份证OCR的收费是按照调用接口的次数计算的。例如,若识别身份证的正反面各一次,则计费为两次。具体价格详情,请参阅我们的产品定价信息。

Q12:文字识别返回的文字类型和存储方式是什么?
识别完成后,返回的结果是JSON格式的字符串。用户可以根据需要选择不同的存储方式。

现在注册,即享新用户礼包!

在线咨询
电话咨询

服务热线:

4008 808 898

服务热线(工作时间):

4008 808 898

业务咨询(非工作时间):

4008 808 898

售后咨询(非工作时间):

4008 808 898

验证码已发送到您的手机,请查收!

填写验证码后,点击“开通体验账户”自动开通体验账户。

收不到短信验证码?
×