初学者机器学习教程

栏目: 数据库 · 发布时间: 5年前

内容简介:数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。数据科学家需要具备以下技能:作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/

数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。

数据科学家需要具备以下技能:

  • 基本工具:像python,R或SQL。 你不需要知道一切。 你只需要学习如何使用python
  • 基本统计:像平均值,中位数或标准差。 如果您了解基本统计信息,则可以轻松使用python。
  • 数据处理:处理混乱和困难的数据。 就像一个不一致的日期和字符串格式。 正如你猜的那样,python帮助了我们。
  • 数据可视化:标题实际上是解释性的。 我们将使用像matplot和seaborn库这样的 python 来可视化数据。
  • 机器学习:你不需要理解机器学习技术背后的数学。 您只需要了解机器学习的基础知识,并学习如何使用python时实现它。

作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/

在本教程中,我不打算对您您学习机器学习,我将解释如何自己学习一些东西。 孔子:授人以鱼不如授人以渔。

目录

  • Python简介:
    • Matplotlib
    • 字典
    • Pandas
    • 逻辑,控制流和过滤
    • 循环数据结构
  • Python 数据科学 工具
    • 用户定义的函数
    • 范围
    • 嵌套函数
    • 默认和灵活的参数
    • Lambda函数
    • 匿名函数
    • 迭代器
    • 列表组合
  • 清洗数据
    • 诊断数据已进行清洗
    • 探索性数据分析EDA
    • 可视化探索性数据分析
    • 整洁的数据
    • 数据透视
    • 数据合并
    • 数据类型
    • 缺失数据和使用assert进行测试
  • Pandas基础
    • Pandas回顾
    • 从零开始构建数据框
    • 可视化探索性数据分析
    • 统计化探索性数据分析
    • 索引化Pandas时间序列
    • 重采样Pandas时间序列
  • 使用Pandas操作数据
    • 索引数据框
    • 切片数据框
    • 过滤数据框
    • 转换数据框
    • 索引对象和标签数据
    • 分层索引
    • 透视数据框
    • 堆叠和不堆叠数据框
    • 融化数据框
    • 类别和分组
  • 数据可视化
    • Seaborn:https://www.kaggle.com/kanncaa1/seaborn-for-beginners
    • Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-1
    • Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-2
  • 统计思维
    • https://www.kaggle.com/kanncaa1/basic-statistic-tutorial-for-beginners
  • 机器学习
    • 有监督学习
      • EDA(探索性数据分析)
      • K-Nearest Neighbors(KNN)
      • 回归
      • 交叉验证(CV)
      • 超参数调整
      • 数据预处理
    • 无监督学习
      • K均值聚类
      • 聚类评价
      • 标准化
      • 层次结构
      • T - 分布式随机邻域嵌入(T - SNE)
      • 主成分分析PCA
  • 深度学习
  • https://www.kaggle.com/kanncaa1/deep-learning-tutorial-for-beginners
  • 时间序列预测
  • https://www.kaggle.com/kanncaa1/time-series-prediction-tutorial-with-eda
  • 用Pytorch做深度学习
  • 人工神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
  • 卷积神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
  • 循环神经网络:https://www.kaggle.com/kanncaa1/recurrent-neural-network-with-pytorch

原文链接: https://www.kaggle.com/kanncaa1/machine-learning-tutorial-for-beginners

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

图解CIO工作指南(第4版)

图解CIO工作指南(第4版)

[日] 野村综合研究所系统咨询事业本部 / 周自恒 / 人民邮电出版社 / 2014-3 / 39.00

《图解CIO工作指南(第4版)》是一本实务手册,系统介绍了企业运用IT手段提高竞争力所必需的管理方法和实践经验,主要面向CEO或CIO等企业管理人士。 《图解CIO工作指南(第4版)》分为三个部分。第1部分的主题为IT管理,着重阐述运用IT技术提高企业竞争力所必需的所有管理业务,具体包括制定作为企业方针的IT战略,以及统筹执行该战略时与IT相关的人力、物力、财力、风险等要素在内的一系列管理业......一起来看看 《图解CIO工作指南(第4版)》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试