基于python的大数据分析实战学习笔记-pandas（数据分析包）

pandas是什么呢？可能大家会看到各种解释，其实ta就是一个数据分析包啊。。。。。没啥可解释的

成都创新互联专注为客户提供全方位的互联网综合服务，包含不限于网站设计、网站建设、开平网络推广、微信小程序、开平网络营销、开平企业策划、开平品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等，从售前售中售后，我们都将竭诚为您服务，您的肯定，是我们最大的嘉奖；成都创新互联为所有大学生创业者提供开平建站搭建服务，24小时服务热线：028-86922220，官方网址：www.cdcxhl.com

pandas中常见的数据结构有三种，Series（一维数组，也叫序列），DataFrame（二维表格，类似excel多行多列），Panel（三维数组）

那什么是数据结构呢？就是相互之间存在的一种或多种特定关系的数据类型的集合。

好了，概念就是这么简单，相信有python基础的朋友应该很容易理解，如果你没有。。。。恩。。。就没有吧

今天我们先来介绍下Series的用法，直接撸代码，里面有注释

from pandas import Series

#定义一个序列
"""
一个序列可以存放不同的数据类型，索引index也是可以忽略的，可以通过下标访问（从0开始）

运行可能会报错：
ImportError: C extension: No module named 'pandas._libs.tslib' not built. If you want to import pandas from the source directory, you may need to run 'python setup.py build_ext --inplace --force' to build the C extensions first.
解决方法：
先
pip3 uninstall pandas
在
pip3 install --user pandas
"""
x=Series(['a',True,1],index=['first','second','thrid'])

print('通过下标取值',x[1])
print('通过索引取值',x['second'])

#x[3] 不能越界访问会报错

#x.append(666)#不能追加单个元素

n=Series([666],index=['fourth'])#可以追加一个序列
print('新增序列之后',x.append(n))


if 1 in x.values:
    print('good')
    
#切片
print('切片：',x[1:3])

#定位获取，常用于随机抽样
print(x[[0,2,1]])

#删除
#x.drop(0)#根据下标
#x.drop('first')#根据索引

#按照下标找到索引名
print(x.index[2])

#根据值删除，返回新序列
#x[2!=x.values

#修改值
x.index[True==x.values]

#将字典转为series
#Series(字典格式)

#对index进行排序
y=Series([2,3,1,5],index=['a','c','b','d'])
print(y.sort_index(ascending=True))#ascending控制升还是降

OS：写代码虽然累，但确实爽，你还不体验下？

本文名称：基于python的大数据分析实战学习笔记-pandas（数据分析包）
标题链接：http://scyanting.com/article/joecce.html

基于python的大数据分析实战学习笔记-pandas（数据分析包）

其他资讯