19
07/2016
《利用Python进行数据分析》读书笔记
安装EPDFree
书中前言部分,介绍了本书需要用到的一些库,以及安装一些基本工具。EPDFree的安装中,书中指明,若电脑已经安装了Python,则需要先卸载。然而,本人通过实践,发现即使系统中已经安装了Python,也能够正常安装EPDFree。安装步骤如下:
(1)下载软件:https://store.enthought.com/downloads/#default,我的版本为:canopy-1.7.3-win-64.msi
(2)点击安装即可。
(3)安装成功后,桌面上会出现两个快捷方式:
(4)打开PyLab(64-bit)快捷方式,在弹出的黑框框中输入:
import pandas plot(arange(10))
会弹出一个窗口。如下图所示。
证明安装成功
另外,把这个数据包包给下了,为后续工作做准备:https://github.com/wesm/pydata-book
--------2016.07.19-----------
第2章 引言
分析MovieLens 1M数据集中时,执行以下代码:
mean_ratings = data.pivot_table('rating', rows = 'title', cols = 'gender', aggfunc = 'mean')
报错:
--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-20-669a36c33797> in <module>() ----> 1 mean_ratings = data.pivot_table('rating', rows = 'title', cols = 'gender', aggfunc = 'mean') TypeError: pivot_table() got an unexpected keyword argument 'rows'
是因为Pandas升级后,一些接口关键字变了。改为:
mean_ratings = data.pivot_table('rating', index='title', columns='gender', aggfunc='mean')
即可。
转载请注明:康瑞部落 » 《利用Python进行数据分析》读书笔记
0 条评论