设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 重新 试卷 文件
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

Python 从爬虫到数据分析(3)

发布时间:2019-05-16 02:21 所属栏目:21 来源:大鹏
导读:9行代码,我们完成了Excel里的透视表、拖动、排序等鼠标点击动作。最后再用Python中的可视化包matplotlib,快速出图: B.函数化分析 以上是一个简单的统计分析过程。接下来就讲讲Excel基础功能不能做的事自定义函数

9行代码,我们完成了Excel里的透视表、拖动、排序等鼠标点击动作。最后再用Python中的可视化包matplotlib,快速出图:

Python 从爬虫到数据分析

Python 从爬虫到数据分析

B.函数化分析

以上是一个简单的统计分析过程。接下来就讲讲Excel基础功能不能做的事——自定义函数提效。观察数据可以发现,数据中记录了周票房和总票房的排名,那么刚刚计算了周票房排名的代码,还能不能复用做一张总票房分析呢?

Python 从爬虫到数据分析

当然可以,只要使用def函数和刚刚写好的代码建立自定义函数,并说明函数规则即可:

  1. def pypic(pf): 
  2.     #定义一个pypic函数,变量是pf 
  3.     dataTop1_sum = data[['电影名',pf]] 
  4.     #取出源数据中,列名为“电影名”和pf两列数据 
  5.  
  6.     dataTop1_sum = dataTop1_sum.groupby('电影名').max()[pf].reset_index() 
  7.     #用“电影名”来分组数据,相同电影连续霸榜的选择最大的pf票房保留,其他数据删除 
  8.  
  9.     dataTop1_sum = dataTop1_sum.sort_values(by=pf,ascending=False) 
  10.     #将数据按照pf进行降序排序 
  11.  
  12.     dataTop1_sum.index = dataTop1_sum['电影名'] 
  13.     del dataTop1_sum['电影名'] 
  14.     #整理index列,使之变为电影名,并删掉原来的电影名列 
  15.  
  16.     dataTop1_sum[:20].iloc[::-1].plot.barh(figsize = (6,10),color = 'orange') 
  17.     name=pf+'top20分析' 
  18.     plt.title(name) 
  19.     #根据函数变量名出图 

定义函数后,批量出图so easy:

Python 从爬虫到数据分析

Python 从爬虫到数据分析

学会函数的构建,一个数据分析师才算真正能够告别Excel的鼠标点击模式,迈入高效分析的领域。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读