机器学习入门

【摘要】浏览网页无意中点进CSDN上的机器学习_入门经典这门课程,虽说到现在为止我给自己定的方向和机器学习没关系,但是好奇心的强烈推动,驱使着我想要揭开听起来就高大上的机器学习的神秘面纱。

第一章:前言

为什么学习编程?

“Everybody in this country should learn how to program a computer…because it teaches you how to think.”–Steve Jobs

Bill Create Microsoft 13岁开始接触电脑;Jack Create twitter;扎克伯格 Facebook 六年级接触电脑;CHRIS NBA ALL-STAR CODE IN COLLEGE;…

2014年英国将编程列为必修课;2019年日本把编程列入小学必修课;2018年3月计算机二级加入了”Python语言程序设计“;

编程入门网站:https://code.org/

第二章:机器学习概述

机器学习是什么?

机器学习就是电脑通过学习数据来近似模仿人脑,自动做出决策。

在面对一件问题时,我们人世根据经验来决策(Learn from experience),而计算机是根据指令进行的(Follow instructions),但是机器可以Learn from data。

第三章:Python机器学习资源

Python机器学习书籍推荐

Python经典书籍推荐,左边入门,右边机器学习原理。

Python第三方包下载地址

针对windows非官方的第三方扩展包下载网站:https://www.lfd.uci.edu/~gohlke/pythonlibs/

Python机器学习常用的包

学习顺序:Numpy –> Pandas –> Matplotlib&Seaborn –> Scipy&Statsmodels –> Sklearn –> TensorFlow&Keras&openCV

  • Numpy:关于Python自然科学计算的包,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。https://numpy.org/
  • Pandas:是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。https://pandas.pydata.org/
  • Matplotlib:Matplotlib 是 Python 的绘图库。https://matplotlib.org/
  • Seaborn:和Matplotlib对比Seaborn是Matplotlib的强大的一个扩展。http://seaborn.pydata.org/
  • Scipy:是一个开源的数学、科学和工程计算包。https://www.scipy.org/
  • Statsmodels:是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。https://www.statsmodels.org/stable/index.html
  • Sklearn:Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。https://scikit-learn.org/stable/
  • TensorFlow:是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。https://tensorflow.google.cn/
  • Keras:是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。https://keras.io/zh/
  • openCV:是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库。https://opencv.org/

机器学习知名数据库介绍

加州大学欧文分校提出的用于机器学习的数据库:http://archive.ics.uci.edu/ml/index.php

第四章:监督机器学习算法

线性回归-房价预测

线性回归和误差 (Linear Regression And Error)

误差最小的方程式位置-梯度下降(最小二乘法)

多项式回归

逻辑回归-预测考试成绩是否能被大学录取

Logistic Regression 逻辑回归用于解决二分类问题。

逻辑回归在信用评分卡有几十年应用。

梯度递减。

决策树-APP智能推荐系统

Recommending Apps

朴素贝叶斯-垃圾邮件过滤系统应用

Detecting Span e-mails

SVM支持向量原理

(Support Vector Machine)

什么是margin和hyperplane(超平面)?

Kernel Trick(核函数)

神经网络算法自动玩超级马里奥

第五章:无监督学习算法

kmean-如何选择披萨店地址

K-Means Clustering

层次聚类算法hierarchical clustering

第六章:Python机器学习实战

Anaconda下载和安装

https://www.anaconda.com/

Python第三方包安装

1
2
3
conda install basemap
# 或者
pip intsall numpy

Python机器学习实战-泰坦尼克号生存分析

Python信用评分卡-风控信贷守护神

Python风控建模实战

lendingclub-2018年新算法秒杀xgboost

金融现金贷用户数据分析和画像

Python机器学习乳腺癌细胞挖掘

第七章:蒙特卡洛算法

python蒙特卡洛算法与赌博模型

结束语

这个视频实战部分主要是推荐课程的,加上我目前本职工作并不是做Python机器学习的,所以也就没有再往下看。从视频中可以听出来机器学习这一块比较重视数学和算法功底。确实比我这CRUD程序员吊!

评论