2020-12-27
数据分析
00

title: 学习 pandas [01]: 数据结构 slug: series-and-dataframe date: 2020-12-27 tags:

  • Pandas
  • Jupyter
  • python category: 数据分析 link: description: type: text

数据结构

pandas的数据类型主要有:

  • Series,类似一维数组
  • DataFrame,类似二维数组
2020-12-16
数据分析
00
2020-12-14
数据分析
00

title: 学习 seaborn [05]: 调色板 slug: color-seaborn date: 2020-12-14 tags:

  • seaborn
  • python category: 数据分析 link: description: type: text

选择调色板

调色板是一组颜色搭配方案,绘图时候程序从中选取颜色进行数据可视化。调色板中颜色之间的色相、饱和度、明度等差异,区别出不同系列的数据关系,因此调色板比其他元素更加影响绘图的视觉效果。

seaborn提供了一些现成的配色方案,也可以利用其提供的函数自定义调色板。

2020-12-11
数据分析
00

title: 学习 seaborn [04]: 修改样式、移动座标轴 slug: beautify-seaborn date: 2020-12-11 16:23:05 tags:

  • seaborn
  • python category: 数据分析 link: description: type: text

控制图像的美学样式

相比与matplotlib详细的样式设置,seaborn提供了成套的样式主题可供直接使用,同时提供高级设置接口供用户自定义主题。

以装修房子比喻,用matplotlib就像全部考自己装修,窗台、地砖、墙壁等细节都要自己考虑,费时费力但高度可定制化。而用seaborn相当于从装修公司已设计好的装修方案中挑选一个,然后还能在此基础进行部分的修改定制。

显然seaborn在效率和美观之间能达到平衡。

seaborn设置样式主要用到这几个函数:

  • axes_style()set_style():设置图像样式,前者用于返回样式设置的参数字典;
  • plotting_context()set_context():设置元素样式,前者用于返回样式设置的参数字典;
  • despine():移除座标轴或修改座标轴位置。
2020-12-09
数据分析
00

title: 学习 seaborn [03]: 线性回归图 slug: lmplot date: 2020-12-9 tags:

  • seaborn
  • python category: 数据分析 link: description: type: text

线性关系可视化

此线性可视化并非统计关系中的折线图,而是excel做图中的趋势线概念,对x、y关系进行线性拟合得到关系式,对关系式的绘图。

seaborn的线性可视化不直接提供拟合关系式的各具体参数,只绘制出趋势线和置信区间,从而引导和帮助进行数据关系探索。

主要用到两个函数:

  • lmplot():FacetGrid级函数,可绘制多子图;将data作为必须参数,x和y变量必须被指定为字符串。
  • regplot():轴级函数。x和y可以是简单的 numpy 数组,pandas Series对象,或者作为对传递给data的 pandas DataFrame对象。