python获取NLPIR网站数据-创新互联

有个自然语言处理的人工智能网站特别有意思,还能快速生成可视化图表,推荐给大家:http://ictclas.nlpir.org/nlpir/
如何爬取这个网站隐藏在背后的数据呢?
我这里演示一下联想词数据的爬取:

金口河ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为成都创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:13518219792(备注:SSL证书合作)期待与您的合作!
import requests,json

content=str(input('请输入要查询的文本:'))
url='http://ictclas.nlpir.org/nlpir/index6/getWord2Vec.do'
headers={
    'Referer': 'http://ictclas.nlpir.org/nlpir/',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
data={
    'content': content
}
res=requests.post(url,headers=headers,data=data)

res_dic=json.loads(res.text)
w2vlist=res_dic['w2vlist']
for i in range(10):
    word=w2vlist[i]
    print(word)

这个网站的可视化功能也很强大,一键生成美丽图表~
这是快速生成词云图,用python的话比较麻烦一些,好处是可以进行个性化修改。如果没有太高要求的话,nlpir网站完全可以胜任:
python获取NLPIR网站数据
还有很多可视化图表,小伙伴们可以去尝试一下:
python获取NLPIR网站数据

另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


网站名称:python获取NLPIR网站数据-创新互联
网站URL:http://scyanting.com/article/dopogj.html