通过百度文字识别的API来实现把图片内容写入到txt文件-创新互联
1、首先去百度注册一个账户,然后选择对应的识别类型创建对应的应用,获取AppID,APIKey,SecretKey,请参考百度官方接入文档http://ai.baidu.com/docs#/Begin/top
2、官方使用文档http://ai.baidu.com/docs#/OCR-Python-SDK/top
#-*- coding: UTF-8 -*-
#前提是python已安装aip库--》pip install baidu-aip
import os
from aip import AipOcr
import json
APP_ID = '你注册账号创建应用后得到的APPID'
API_KEY = '你注册账号创建应用后得到的API_KEY'
SECRET_KEY = '你注册账号创建应用后得到的SECRET_KEY '
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
os.chdir("E:\\office\\src_pic") #你需要转换的图片目录
dirs = os.listdir()
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
print('开始处理,共'+str(len(dirs))+"张图片。")
flag=0
T = 0 #统计处理图片成功的数量
for filePath in dirs:
if filePath.split('.')[-1]=='txt':continue
flag+=1
print('正在处理第'+str(flag)+'张图片')
try:
result = aipOcr.basicGeneral(get_file_content(filePath), options)
except BaseException as e:
print(e)
else:
try:
with open(filePath.split('.')[0]+'.txt','w',encoding='utf-8') as f:
for i in result['words_result']:
f.write(i['words']+'\n')
T += 1
except BaseException as e :
print(e)
else:
print('处理完成')
print('{}全部处理完成!{}'.format("="*30,"="*30))
print('处理成功的图片有{}张,处理失败的图片有{}张'.format(T,len(dirs)-T))
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
名称栏目:通过百度文字识别的API来实现把图片内容写入到txt文件-创新互联
网站网址:http://scyanting.com/article/dhjjgo.html