OCR识别 - 常见问题

什么是OCR？
OCR（Optical Character Recognition），即光学字符识别，是一项先进技术。它通过扫描等光学手段，将各类票据、报刊、书籍、文稿以及其他印刷品中的文字转换为图像信息。随后，利用文字识别技术，这些图像信息被转化为可以电子化处理的格式，方便计算机输入和使用。

文字识别功能能识别哪些内容？
基于深度学习技术的文字识别（OCR）可以智能地将图片中的文字内容转换为可编辑的文本格式。此技术支持多种场景下的通用文字、卡证文字、票据单据等印刷体和手写体文字的识别。此外，它还包括票据核验功能，有效替代传统的人工录入方式，极大提升工作效率。

接入文字识别OCR服务，需要开发编程能力吗？
接入文字识别OCR服务需要一定的编程开发能力。用户需进行二次开发对接，并通过调用API接口，实现从图片或扫描件中提取文字并转换为可编辑文本的功能。识别提取后的结果需通过编程技术与用户的业务系统相结合，或保存为TXT、Excel等文件格式。

我购买了通用印刷体识别资源包，各版本接口都可以使用吗？
不可以。通用印刷体识别、通用印刷体识别（高速版）和通用印刷体识别（高精度版）是三个独立的接口，各自的资源包不能混用。若您购买的是通用印刷体识别资源包，则仅限于该接口的使用。

文字识别OCR有哪些应用场景？
OCR技术广泛应用于多个领域：它能自动识别图片或视频帧中的关键文字信息，使信息搜索与审核更加迅速和精准，极大地提升信息分发与管理水平。同时，OCR技术还可用于文档电子化，如办公文件、合同文档、法律卷宗等，通过识别这些纸质文档中的文字信息，便于文件的保存、分类和检索。

怎么提高识别的准确率和识别速度？
提高文字识别的准确率和速度，需注意以下几点：确保拍摄光照、背景和清晰度适宜。建议上传JPG格式的图片，且文件大小不超过1M。在采集图片时，尽可能放大要识别的文字区域，保证文字清晰可辨。适当压缩图片大小，也能有效缩短识别时间。

文字识别是否支持方向旋转/不同朝向的图片文字识别？
大多数文字识别能力已经支持图像方向的自动校正，可以正确识别旋转的图片中的文字。

文字识别是否可以批量识别？
目前，文字识别技术不支持批量识别。每次调用只能识别单张图片，但您可以在QPS允许的范围内进行多线程调用。

可以识别PDF、Word、Excel等格式文件吗？
目前支持JPG、JPEG、BMP、TIF、WebP等图片格式及PDF文档的识别，但暂不支持Word、Excel等格式。如需识别这些格式的文本，可先将其转换为图片或PDF格式后再进行上传。

为什么文字识别结果不准确？
文字识别结果不准确可能有多种原因：图片尺寸过小，低于15px；图片画质差，如过暗、内容不清晰；文字内容被水印、印章或褶皱等遮挡；图片样式与接口支持类型不符，如身份证识别仅支持二代居民身份证。如遇错误码，请参考相应的错误码进行问题排查。

身份证OCR是如何收费的？
身份证OCR的收费是按照调用接口的次数计算的。例如，若识别身份证的正反面各一次，则计费为两次。具体价格详情，请参阅我们的产品定价信息。

文字识别返回的文字类型和存储方式是什么？
识别完成后，返回的结果是JSON格式的字符串。用户可以根据需要选择不同的存储方式。

互亿无线 · 文档中心

OCR识别 - 常见问题

现在注册，即享新用户礼包!