力压 R,Python 在数据科学领域风生水起

栏目: R语言 · 发布时间: 6年前

内容简介:TIOBE 最新发布的 9 月编程语言排行榜中,Python 凭 4.67% 的增速以 0.26% 的优势力压 C++,逆袭成功进入 Top 3。而近一年势头不灭的 Python 在数据分析领域,是专家们的必备技能。随着 IT 行业的增长,对有经验的数据科学家的需求也水涨船高,而 Python 也一跃而成最受欢迎的语言。本文旨在介绍分析数据的基本知识,并利用 Python 创建一些漂亮的数据可视化。

TIOBE 最新发布的 9 月编程语言排行榜中,Python 凭 4.67% 的增速以 0.26% 的优势力压 C++,逆袭成功进入 Top 3。

而近一年势头不灭的 Python 在数据分析领域,是专家们的必备技能。随着 IT 行业的增长,对有经验的数据科学家的需求也水涨船高,而 Python 也一跃而成最受欢迎的语言。本文旨在介绍分析数据的基本知识,并利用 Python 创建一些漂亮的数据可视化。

力压 R,Python 在数据科学领域风生水起

概要

数据科学领域,非 Python 语言莫属?

Python 是最适合数据科学家的语言,这一点毫无争议。下面几点可以帮你理解为什么从事数据科学的人选择了 Python:

你知道最大的好处是什么吗?数据科学家是目前收入最高的职位之一,根据 Indeed.com 的数据,平均年薪为 $130,621。

Python 由 Guido Van Rossum 于 1989 年创建。它是个解释语言,拥有动态语义。它在所有的平台上可以免费使用。Python 是:

力压 R,Python 在数据科学领域风生水起

为数据科学中的 Python 安装 Jupyter

我们先来在自己的系统上安装 Jupyter。请按照以下步骤进行:

我建议你使用 Anaconda 发行版(https://www.anaconda.com/download/)安装 Python 和 Jupyter。装好Jupyter 之后,可以在命令行中输入“Jupyter Notebook”即可在默认浏览器中打开。现在我们在 Jupyter 上写个最基本的程序。

name=input( "Enter your Name:")  
print( "Hello", name) 

要运行这段代码,可以按下“Shift+Enter”,即可查看输出。如下面的截图所示:

力压 R,Python 在数据科学领域风生水起

数据科学中的 Python 的基础

现在可以开始编程了。为了编程,你需要先了解以下的基础知识:

关于 Python的更多信息和实际的实现,可以参考这篇文章:Python 入门(https://www.edureka.co/blog/python-tutorial/)。

数据科学中的 Python 库

这是 Python 在数据科学中发挥力量的部分。Python 拥有大量用于科学计算、分析、可视化等的库。一些库如下:

Demo:实际应用

问题描述:给定一组数据集,该数据集是由多种数据组成的综合统计数据,如监狱设施的分布和情况、监狱的拥挤程度、监狱中的犯人类型,等等。请在这个数据集上做描述性的统计,并从数据中找出有用的信息。下面是几个任务:

加载数据使用以下代码:

importpandas aspd  
importmatplotlib.pyplot asplot  
%matplotlib inline  
file_name = "prisoners.csv"  
prisoners = pd.read_csv(file_name)  
prisoners 
力压 R,Python 在数据科学领域风生水起

然后用 Pandas 的 describe 方法,只需输入以下语句:

prisoners.describe() 
力压 R,Python 在数据科学领域风生水起

然后进行数据操作:

prisoners[ "total_benefited"]=prisoners.sum(axis=1)  
prisoners.head() 
力压 R,Python 在数据科学领域风生水起

最后,用 Python 做一些数据可视化。代码如下:

importnumpy asnp  
xlabels = prisoners[ 'STATE/UT'].values  
plot.figure(figsize=( 20, 3))  
plot.xticks(np.arange(xlabels.shape[ 0]), xlabels, rotation = 'vertical', fontsize = 18)  
plot.xticks  
plot.bar(np.arange(prisoners.values.shape[ 0]),prisoners[ 'total_benefited'],align = 'edge') 
力压 R,Python 在数据科学领域风生水起

以上所述就是小编给大家介绍的《力压 R,Python 在数据科学领域风生水起》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

浅薄

浅薄

[美]尼古拉斯·卡尔 / 刘纯毅 / 中信出版社 / 2015-11 / 49.00 元

互联网时代的飞速发展带来了各行各业效率的提升和生活的便利,但卡尔指出,当我们每天在翻看手机上的社交平台,阅读那些看似有趣和有深度的文章时,在我们尽情享受互联网慷慨施舍的过程中,我们正在渐渐丧失深度阅读和深度思考的能力。 互联网鼓励我们蜻蜓点水般地从多种信息来源中广泛采集碎片化的信息,其伦理规范就是工业主义,这是一套速度至上、效率至上的伦理,也是一套产量最优化、消费最优化的伦理——如此说来,互......一起来看看 《浅薄》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具