Python中如何实现文字识别功能

这期内容当中小编将会给大家带来有关Python中如何实现文字识别功能，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

网站建设哪家好，找成都创新互联公司！专注于网页设计、网站建设、微信开发、微信平台小程序开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了息烽免费建站欢迎大家使用！

环境和配置要求

整体是用Python实现，所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller，如未安装，可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。

百度接口

打开https://cloud.baidu.com/，

如未注册请先注册，然后登录点击管理控制台，点击左侧产品服务→人工智能→文字识别，点击创建应用，输入应用名称如Baidu_OCR，选择用途如学习办公，最后进行简单应用描述，即可点击立即创建。

会出现应用列表，包括AppID、API Key、Secret Key等信息，这些稍后会用到。

具体实现步骤

整个程序的大致思路是，在用截图软件获得截图之后，交给百度接口识别，并返回结果，当然，也可以是本地图片识别，我用的是QQ自带截图软件，快捷键CTRL+ALT+A用来打开截图，在选中所截区域后，按Enter键即可保存到粘贴板中，也可用其他截图软件。

①获取截图

keyboard类库是用来监听键盘动作的，所以在有快捷键按下之后，便会有相应动作。并用PIL中的ImageGrab来获取到剪切板中的图片并生成本地图片文件。

#1.截图
keyboard.wait('ctrl+alt+a')
print('开始截图')
 
keyboard.wait('enter')
print('保存截图')
time.sleep(0.1)
 
#2.保存图片
image = ImageGrab.grabclipboard()
image.save('img.png')

②调用Baidu aip识别并打印文字

先用注册时生成的应用的AppID、API Key、Secret Key初始化应用，再读取保存到的图片并打印识别的文字。

with open('img.png', 'rb') as fp:
    image = fp.read()
    text_list = client.basicAccurate(image)['words_result']
    for text in text_list:
        print(text['words'])

运行结果如图所示：

上述就是小编为大家分享的Python中如何实现文字识别功能了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注创新互联行业资讯频道。

本文名称：Python中如何实现文字识别功能
文章来源：http://scyanting.com/article/jjccid.html

Python中如何实现文字识别功能

百度接口

具体实现步骤

①获取截图

②调用Baidu aip识别并打印文字

其他资讯