数据分析将杂乱的数据整理出有价值的信息并显示Jupyter介绍测试使用,无需使用print即可输出结果ctrl 回车快速执行Shift 回车可以创建新的代码块可以跨单元格访问变量同属于一个代码文件Pandas简介类似表格的形式左侧是索引单独取出一列可以看到形式就和series相同其实取出的就是series求最小值最大值平均值函数,min,max,mean想输出三行但只输出一行是由于该状态下执行只会执行最后一句DataFrameIndex属性dataframe可以通过tolist来转化为列表的形式获取列标签获取所有值获取列表元素个数获取数据类型获取行数和列数Series列表创建元组创建字典创建Series属性索引index值values元素个数size元素类型dtypes是底层numpy的类型行数shape小结数据的读取与写入读入数据其中usecols表示要使用哪些列把列名写上去即可数据处理增加销售金额这列写入数据将修改的后内容写入到新的csv文件中小结数据查看、选择、过滤查看前10行数据head(10)查看后10行数据tail(10)数据统计信息describe,25%表示低于25%的商品都是低于49的,剩下的以此类推std用不到查看数据信息,显示列名非空计数数据类型等Non-Null表示非空数据选择单列直接查看列名多列在列表中再嵌套一个列表选择行基于行号来选择行的df.iloc[0:5:1]选择行基于索引来选择行df.loc[0:5:1]但若是index_col’订单号’那么将无法使用因为索引是订单号的内容选择只能依据索引号来实现数据的过滤Df[filter],df[‘销售数量’]得到销售数量的列然后再写出要求最后再去查找进行过滤数据指定内容使用isin方法传入列表来进行筛选范围匹配,使用between方法包含边界值可以设置是否包含边界可选择左右边界选择其中一个那么就只包含选择的那个边界不包含另一个也可以选择neither两边都不包含多个条件的数据过滤使用连接符进行连接并且单个的条件要用()括起来综合应用由于数据过长无法展示所有数据因此可以进行配置让其给我们全部展示数据但注释掉配置项还是会全部显示是由于有缓存存在只需要点击restart即可然后再重新运行但由于重新加载会导致前面的代码块运行内容消失因此无法根据前面的import pandas来进行导入需要重新导入或者再次运行前面的代码块无需重新导入小结
python学习第十二天(自用)
数据分析将杂乱的数据整理出有价值的信息并显示Jupyter介绍测试使用,无需使用print即可输出结果ctrl 回车快速执行Shift 回车可以创建新的代码块可以跨单元格访问变量同属于一个代码文件Pandas简介类似表格的形式左侧是索引单独取出一列可以看到形式就和series相同其实取出的就是series求最小值最大值平均值函数,min,max,mean想输出三行但只输出一行是由于该状态下执行只会执行最后一句DataFrameIndex属性dataframe可以通过tolist来转化为列表的形式获取列标签获取所有值获取列表元素个数获取数据类型获取行数和列数Series列表创建元组创建字典创建Series属性索引index值values元素个数size元素类型dtypes是底层numpy的类型行数shape小结数据的读取与写入读入数据其中usecols表示要使用哪些列把列名写上去即可数据处理增加销售金额这列写入数据将修改的后内容写入到新的csv文件中小结数据查看、选择、过滤查看前10行数据head(10)查看后10行数据tail(10)数据统计信息describe,25%表示低于25%的商品都是低于49的,剩下的以此类推std用不到查看数据信息,显示列名非空计数数据类型等Non-Null表示非空数据选择单列直接查看列名多列在列表中再嵌套一个列表选择行基于行号来选择行的df.iloc[0:5:1]选择行基于索引来选择行df.loc[0:5:1]但若是index_col’订单号’那么将无法使用因为索引是订单号的内容选择只能依据索引号来实现数据的过滤Df[filter],df[‘销售数量’]得到销售数量的列然后再写出要求最后再去查找进行过滤数据指定内容使用isin方法传入列表来进行筛选范围匹配,使用between方法包含边界值可以设置是否包含边界可选择左右边界选择其中一个那么就只包含选择的那个边界不包含另一个也可以选择neither两边都不包含多个条件的数据过滤使用连接符进行连接并且单个的条件要用()括起来综合应用由于数据过长无法展示所有数据因此可以进行配置让其给我们全部展示数据但注释掉配置项还是会全部显示是由于有缓存存在只需要点击restart即可然后再重新运行但由于重新加载会导致前面的代码块运行内容消失因此无法根据前面的import pandas来进行导入需要重新导入或者再次运行前面的代码块无需重新导入小结