Python调用百度OCR实现图片文字识别的示例代码

发布时间：2023/12/17

以下是Python调用百度OCR实现图片文字识别的详细攻略：

一、准备工作

1.1 注册百度云账户并创建应用

在百度云官网（https://cloud.baidu.com/）上注册一个账户，然后创建一个OCR应用。

1.2 安装Python SDK

百度云提供了Python SDK，我们可以通过pip下载并安装。

pip install baidu-aip

1.3 获取API Key和Secret Key

进入自己的百度云控制台，找到刚刚创建的OCR应用，获取API Key和Secret Key。

二、开发实现

2.1 引入百度OCR API

from aip import AipOcr

2.2 设置APPID/AK/SK并调用API

# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'

# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 定义参数变量
options = {
  'language_type': 'CHN_ENG',
}

# 调用通用文字识别接口
result = client.basicGeneral(get_file_content(filePath), options)

# 打印识别结果
print(result)

2.3 参数说明

APP_ID、API_KEY、SECRET_KEY：百度云控制台中获取到的应用信息。
get_file_content(filePath)：读取待识别的图片。
options：参数配置，此处配置为通用文字识别中文和英文混合。
client.basicGeneral：调用通用文字识别API，返回识别结果。

三、示例说明

3.1 单张图片文字识别

# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
FILE_PATH = '你的图片路径'

# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 定义参数变量
options = {
  'language_type': 'CHN_ENG',
}

# 调用通用文字识别接口
result = client.basicGeneral(get_file_content(FILE_PATH), options)

# 打印识别结果
print(result)

3.2 多张图片文字识别

# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
FILE_DIR = '你的图片目录'

# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 定义参数变量
options = {
  'language_type': 'CHN_ENG',
}

# 遍历目录中的图片，并识别文字
for file in os.listdir(FILE_DIR):
    if file.endswith('.jpg') or file.endswith('.png'):
        result = client.basicGeneral(get_file_content(os.path.join(FILE_DIR, file)), options)
        print(result)

以上就是Python调用百度OCR实现图片文字识别的示例代码和攻略，希望能对你有所帮助。