1.熊猫介绍
熊猫是一个开源的,BSD许可的库,为Python编程语言提供了高性能且易于使用的数据结构和数据分析工具。
2.系列用法
熊猫提供了两种最重要的数据结构类型,系列(一维)和数据框架(二维)。今天,我们将首先介绍系列。
Series是一组索引数组,即由一组数据和相关索引组成的一维数据对象。它类似于numpy中的list和array,但是list中的元素可以是不同的数据类型,而另外两个只能是相同的数据类型。
2.1如何创建系列
通过列表 list 创建 Series通过指定 index 关键字的方式创建带有自定义索引的 Series通过numpy创建 Series通过字典 dict 创建 Seriesimportpandas aspdimportnumpy asnp
s1 = pd。系列([ 10,40,5,90,35,40])
打印(s1)
# 0 10
# 1 40
# 2 5
# 3 90
# 4 35
# 5 40
# dt type:int 64
s2 = pd。系列([ 100,79,65,77],索引=[“语文”,“英语”,“历史”,“数学”],名称=‘分数’)
#中文100
#英语79
#历史65
#数学77
#名称:分数,数据类型:int64
s3 = pd。级数(np.linspace(start= 0,stop= 5,num= 5))
打印(s3)
# 0 0.00
# 1 1.25
# 2 2.50
# 3 3.75
# 4 5.00
# dt type:float 64
s4 = pd。系列(np.arange( 10,15))
打印(s4)
# 0 10
# 1 11
# 2 12
# 3 13
# 4 14
# dt type:int 32
D1 = pd。系列({“姓名”:“张三”,“性别”:“男”,“年龄”:20,“身高”:180,“体重”:66})
#名字张三
#性别男性
# 20岁
#高度180
#体重66
# dtype:对象
2.2如何获得级数的性质
index 索引values 值name 名字dtype 类型 print(s1.index)# RangeIndex(start=0,stop=6,step=1)
打印(s1.values)
# [10 40 5 90 35 40]
打印(s1.name)
#无
打印(s1.dtype)
# int64
打印(s2.index)
# Index(['中文','英文','历史','数学'],dtype='object ')
打印(s2.values)
# [100 79 65 77]
2.3如何获取数据
通过位置获取数据通过索引获取数据 print(s1[ 0])# 10
#获取价值
打印(s1[ 0: 2])
# 0 10
# 1 40
# dt type:int 64
打印(s1[[ 0,1,2]])
# 0 10
# 1 40
# 2 5
# dt type:int 64
s2["中文"]
# 100
s2[[“英语”、“历史”]]
#英语79
#历史65
# dt type:int 64
打印(S2[S2 . values & gt;70])
#中文100
#英语79
#数学77
#名称:分数,数据类型:int64
打印(s2[s2.index!= '中文'])
#英语79
#历史65
#数学77
#名称:分数,数据类型:int64
d1[ "name"]
#张三
d1[[“姓名”、“身高”、“体重”]]
#名字张三
#高度180
#体重66
# dtype:对象
2.4基本操作
查看描述性统计
打印(s1.values)
# [10 40 5 90 35 40]
打印(s1 .描述)
#计数6.000000
# mean 36.666667
# std 30.276504
#最低5.000000
# 25% 16.250000
# 50% 37.500000
# 75% 40.000000
#最大90.000000
# dt type:float 64
打印(s1.mean) # mean
# 36.666666666666664
打印(s1 .中位数)#中位数
# 37.5
打印(s1.sum) # Sum
# 220
打印(s1.std) #标准偏差
# 30.276503540974915
打印(s1.mode) #模式
# 0 40
# dt type:int 64
打印(s1.value_counts) #每个值的数量
# 40 2
# 35 1
# 5 1
# 90 1
# 10 1
# dt type:int 64
数学操作
importnumpy asnp
打印(s1.values)
# [10 40 5 90 35 40]
打印(s1/2) #将每个值除以2
# 0 5.0
# 1 20.0
# 2 2.5
# 3 45.0
# 4 17.5
# 5 20.0
# dt type:float 64
打印(s1 // 2) #将每个值除以2并向上舍入
# 0 5
# 1 20
# 2 2
# 3 45
# 4 17
# 5 20
# dt type:int 64
打印(s1% 2) #取余数
# 0 0
# 1 0
# 2 1
# 3 0
# 4 1
# 5 0
# dt type:int 64
打印(s1 ** 2) #方形
# 0 100
# 1 1600
# 2 25
# 3 8100
# 4 1225
# 5 1600
# dt type:int 64
Print(np.sqrt(s1)) #查找公式
# 0 3.162278
# # 1 6.324555
# # 2 2.236068
# # 3 9.486833
# # 4 5.916080
# # 5 6.324555
# # dtype: float64
对数打印(np.log(s1)) #
# 0 2.302585
# 1 3.688879
# 2 1.609438
# 3 4.499810
# 4 3.555348
# 5 3.688879
# dt type:float 64
对齐计算
D2 = pd.series ({'a': 10,' b': 40,' c': 5,' d': 90,' e': 35,' f': 40},name = ' numerical value ')
D3 = pd.series ({'a': 10,' b': 20,' d': 23,' g': 90,' h': 35,' i': 40},name = ' numerical value ')
d4 = d2 + d3
打印(d4)
# a 20.0
# b 60.0
# c NaN
# d 113.0
# e NaN
# f NaN
# g NaN
# h NaN
# i NaN
#名称:数值,数据类型:浮点64
2.5缺失值处理
notnull 找空值isnull 找非空值fillna 填充空值 print(d4[d4.notnull])# a 20.0
# b 60.0
# d 113.0
#名称:数值,数据类型:浮点64
打印(d4[d4.isnull])
# c NaN
# e NaN
# f NaN
# g NaN
# h NaN
# i NaN
#名称:数值,数据类型:浮点64
d4=d4.fillna(d4 .中位数)
打印(d4)
# a 20.0
# b 60.0
# c 60.0
# d 113.0
# e 60.0
# f 60.0
# g 60.0
# h 60.0
# i 60.0
#名称:数值,数据类型:浮点64
2.6删除值
打印(d4.drop( 'b '))
# a 20.0
# c 60.0
# d 113.0
# e 60.0
# f 60.0
# g 60.0
# h 60.0
# i 60.0
#名称:数值,数据类型:浮点64
引用
LSGO软件技术团队将定期开展深思熟虑的实践活动,以提高编程技能。希望大家都能参与深思熟虑的练习,共同学习进步!
我是一个终身学习者,一匹老马,一个长期实践“合伙学习”理念的中年大叔。
我提倡分享,渴望成长。2010年,我成立了“LSGO软件技术团队”,加入了国内著名的开源组织“数据鲸”,也是“Dre@mtech”、“智能机器人研究中心”、“大数据与哲学社会科学实验室”的成员。
愿我们一起学习,一起进步,一起陪伴,一起成长。
后台回复“搜索搜索”,随意获取电子资源!
1.《pandas教程 Pandas的简单入门教程:Series》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《pandas教程 Pandas的简单入门教程:Series》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/757550.html