《利用Python进行数据分析》读书笔记

  • 安装EPDFree

书中前言部分,介绍了本书需要用到的一些库,以及安装一些基本工具。EPDFree的安装中,书中指明,若电脑已经安装了Python,则需要先卸载。然而,本人通过实践,发现即使系统中已经安装了Python,也能够正常安装EPDFree。安装步骤如下:

(1)下载软件:https://store.enthought.com/downloads/#default,我的版本为:canopy-1.7.3-win-64.msi

(2)点击安装即可。

(3)安装成功后,桌面上会出现两个快捷方式:

(4)打开PyLab(64-bit)快捷方式,在弹出的黑框框中输入:

import pandas
plot(arange(10))

会弹出一个窗口。如下图所示。

证明安装成功

另外,把这个数据包包给下了,为后续工作做准备:https://github.com/wesm/pydata-book

--------2016.07.19-----------


  • 第2章 引言

分析MovieLens 1M数据集中时,执行以下代码:

mean_ratings = data.pivot_table('rating', rows = 'title', cols = 'gender', aggfunc = 'mean')

报错:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-20-669a36c33797> in <module>()
----> 1 mean_ratings = data.pivot_table('rating', rows = 'title', cols = 'gender', aggfunc = 'mean')

TypeError: pivot_table() got an unexpected keyword argument 'rows'

是因为Pandas升级后,一些接口关键字变了。改为:

mean_ratings = data.pivot_table('rating', index='title', columns='gender', aggfunc='mean')

即可。

0 条评论

    发表评论

    电子邮件地址不会被公开。 必填项已用 * 标注