文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,著作权归创作者全部,如有什么问题请立即在线留言以作解决

本文章内容来着腾讯云服务 创作者:python学习培训实例教程

文中例举了一些提高或加快日常数据统计分析工作中的方法,包含:

  1. Pandas Profiling

  2. 应用 Cufflinks 和 Plotly 绘图 Pandas 数据信息

  3. IPython 魔术师命令

  4. Jupyter 中的文件格式编辑

  5. Jupyter 键盘快捷键

  6. 在 Jupyter(或 IPython)使得一个模块另外有好几个輸出

  7. 为 Jupyter Notebook 及时建立ppt

1. Pandas Profiling

该专用工具实际效果显著。下面的图展现了启用 df.profile_report() 这一简易方式的結果:


应用该专用工具只需安裝和导进 Pandas Profiling 包。

2. 应用 Cufflinks 和 Plotly 绘图 Pandas 数据信息

「阅历丰富的」大数据工程师或大数据分析师大多数对 matplotlib 和 pandas 很了解。换句话说,你只需启用 .plot() 方式,就可以迅速绘图简易的 pd.DataFrame 或 pd.Series:

有点儿无趣?

这早已很好啦,但是是不是能够绘图一个互动式、可放缩、可拓展的全景图片呢?现在是时候让 Cufflinks* *出马了!(Cufflinks 根据 Plotly 干了进一步的包裝。)

在自然环境中安裝 Cufflinks,只需在终端设备中运作! pip install cufflinks --upgrade 就可以。查询下面的图:

实际效果许多了!

留意,图中唯一更改的是 Cufflinks cf.go_offline() 的导进和设定,它将 .plot() 方式变成 .iplot()。

别的方式如 .scatter_matrix() 还可以出示非常棒的数据可视化結果:

3. IPython 魔术师命令

IPython 的「魔术师」是 IPython 根据 Python 规范英语的语法的一系列提高。魔术师命令包含二种方式:行魔术师命令(line magics):以 % 为作为前缀,在单独键入行上运作;单元格魔术师命令(cell magics):以 %% 为作为前缀,在好几个键入行上运作。下边例举了 IPython 魔术师命令出示的一些有效作用:

%lsmagic:找到所有命令

假如你只还记得一个魔术师命令,那务必得是这一个。实行 %lsmagic 命令将出示全部能用魔术师命令的目录:

�bug:互动式 debug

这很有可能就是我最常应用的魔术师命令了。

绝大多数大数据工程师都遇到过这类状况:实行的代码块一直 break,你失落地写了 20 个 print() 句子,想輸出每一个自变量的內容。随后,如果你最后恢复难题后,你要得回到并再度删掉全部 print() 句子。

但是之后从此无需那样了。碰到难题后只需实行 �bug 命令,就可以实行要想运作的随意编码一部分:

图中中发生什么事?

  1. 大家有一个涵数,它以目录为键入,并对全部的双数取平方米值。
  2. 大家运作涵数,可是出了些难题。可是大家并不了解是怎么回事!
  3. 对该涵数应用�bug 命令。
  4. 让程序调试告知大家 x 和 type(x) 的值。
  5. 难题不言而喻:大家把’6’做为字符串数组键入到涵数中了!

这针对更繁杂的涵数十分有效。

%store:在 notebook 中间传送自变量

这一命令也很帅。假定你花了一些時间清理 notebook 中的数据信息,如今你要在另一个 notebook 中检测一些作用,那麼你是在同一个 notebook 中完成该作用,還是储存数据信息并在另一个 notebook 中载入数据信息呢?应用%store 命令后,这种实际操作都不用!该命令将储存自变量,你能在别的随意 notebook 中查找该自变量:

  • %store [variable] 储存自变量。
  • %store -r [variable] 载入/查找储存自变量。
  • %who:列举全部静态变量。

你是不是遇到过,为自变量取值后却忘记用户标识符的状况?或是一不小心删除了承担为自变量取值的单元格?应用%who 命令,你能获得全部静态变量的目录:

%%time:记时法术命令

应用该命令能够获得全部记时信息内容。只需对随意可实行编码运用%%time 命令,你也就能够获得以下輸出:

%%writefile:向文档载入单元格內容

在 notebook 中写繁杂涵数或类,且想将其储存到专享文档里时,该法术命令十分有效。只能以涵数或类的单元格加上 %%writefile 前缀和要想储存到的文件夹名称就可以:

如上所显示,我们可以将建立的涵数储存到 utils.py 文档中,随后就可以随便导进了。在别的 notebook 中也能够那样,要是与 utils.py 文档归属于同一个文件目录就可以。

4. Jupyter 中的文件格式编辑

这一专用工具很帅!Jupyter 充分考虑 markdown 中存有 HTML / CSS 文件格式。下列就是我最常常应用的作用:

深蓝色、时尚潮流:

<div class="alert alert-block alert-info">
  This is <b>fancy</b>!
</div>

 

鲜红色、轻度惊慌:

<div class="alert alert-block alert-danger">
  This is <b>baaaaad</b>!
</div>

 

翠绿色、宁静:

<div class="alert alert-block alert-success">
 This is <b>gooood</b>!
</div>

 

如果你还以 Notebook 文件格式展现一些发觉时,这十分有效!

5. Jupyter 键盘快捷键

想掌握和学习培训快捷键,你能应用命令控制面板:Ctrl Shift P,获得 notebook 全部作用的目录。下边选择了好多个最基本的命令:
Esc:进到命令方式。在命令方式内,你能应用键盘按键在 notebook 内开展导航栏。
在命令方式内:

  • A 和 B:在当今单元格上边(Above)或正下方(Below)插进新的单元格。
  • M:当今单元格转到 Markdown 情况。
  • Y:当今单元格转到 code 情况。
  • D,D:删除当前单元格。
  • Enter:当今单元格返回编写方式。
    在编写方式内:
  • Shift Tab:给你在当今单元格中输入的目标出示文本文档字符串数组(文本文档),不断应用该键盘快捷键,可循环系统应用文本文档方式。
  • Ctrl Shift -:在鼠标光标所属处切分当今单元格。
  • Esc F:搜索并更换编码(不包括輸出)。
  • Esc O:转换单元格輸出。

挑选好几个单元格:

  • Shift Down 和 Shift Up:选定正下方或上边的单元格。
  • Shift M:合拼选定单元格。

留意,选定好几个单元格后,你能大批量实行删掉/拷贝/裁切/黏贴/运作实际操作。

6. 在 Jupyter(或 IPython)使得一个模块另外有好几个輸出

想展现 pandas DataFrame 的 .head() 和 .tail(),但因为建立运作 .tail() 方式的附加编码模块过度不便而迫不得已半途舍弃,你是不是经历那样的历经?如今无需怕了,你能应用下列编码行展现你要展现的輸出:

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

下面的图呈现了好几个輸出的結果:

7. 为 Jupyter Notebook 及时建立ppt

应用 RISE,你能仅根据一次功能键将 Jupyter Notebook 及时变化为ppt。并且 notebook 依然处在活跃性情况,你能在展现ppt的另外实行即时编号!

要想应用该专用工具,你只需根据 conda 或 pip 安裝 RISE 就可以。

conda install -c conda-forge rise

或是

pip install RISE

如今,你能点一下新按键,为 notebook 建立非常好的ppt了:

文章来源于网络,如有侵权请联系站长QQ61910465删除
本文版权归去快排wWw.seogUrublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系qq❉61910465