Data-Science-Cheatsheet - 一份有用的 5 页机器学习备忘单,可帮助进行考试复习、面试准备以及介于两者之间的任何事情。

Created at: 2021-02-05 14:01:57
Language: TeX

数据科学速查表 2.0

一份有用的 5 页数据科学备忘单,可帮助进行考试复习、面试准备以及介于两者之间的任何事情。它涵盖了一个学期的介绍性机器学习,并基于 MIT 的机器学习课程 6.867 和 15.072。读者至少应该对统计和线性代数有基本的了解,尽管初学者可能会发现此资源也很有帮助。

灵感来自 Maverick 的数据科学备忘单(因此得名 2.0),位于此处

涵盖的主题:

  • 线性和逻辑回归
  • 决策树和随机森林
  • 支持向量机
  • K-最近邻
  • 聚类
  • 提升
  • 降维(PCA、LDA、因子分析)
  • 自然语言处理
  • 神经网络
  • 推荐系统
  • 强化学习
  • 异常检测
  • 时间序列
  • A/B 测试

此备忘单将不时更新新/改进的信息,因此请考虑关注或关注以保持最新状态。

未来的补充(欢迎提出想法):

  • 时间序列 添加!
  • 统计和概率 添加!
  • 数据插补
  • 生成对抗网络

链接

截图

这是几个页面的屏幕截图 - 完整备忘单的链接在上面!

为什么 Python/SQL 没有包含在这个备忘单中?

我计划让这个资源主要涵盖算法、模型和概念,因为这些很少改变并且在整个行业中都很常见。技术语言和数据结构通常因工作方法而异,在键盘上刷新这些技能可能比在纸上更有意义。

授权协议

随时在课堂、复习课或任何可能觉得有用的人中分享此资源:)

本作品已根据知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议获得许可

知识共享许可

图像用于教育目的,创造了由我,或者从我的同事借了这里

接触

随时提出意见、更新和潜在的改进建议!

作者 - Aaron Wang