机器学习入门
【摘要】浏览网页无意中点进CSDN上的机器学习_入门经典这门课程,虽说到现在为止我给自己定的方向和机器学习没关系,但是好奇心的强烈推动,驱使着我想要揭开听起来就高大上的机器学习的神秘面纱。
第一章:前言
为什么学习编程?
“Everybody in this country should learn how to program a computer…because it teaches you how to think.”–Steve Jobs
Bill Create Microsoft 13岁开始接触电脑;Jack Create twitter;扎克伯格 Facebook 六年级接触电脑;CHRIS NBA ALL-STAR CODE IN COLLEGE;…
2014年英国将编程列为必修课;2019年日本把编程列入小学必修课;2018年3月计算机二级加入了”Python语言程序设计“;
编程入门网站:https://code.org/
第二章:机器学习概述
机器学习是什么?
机器学习就是电脑通过学习数据来近似模仿人脑,自动做出决策。
在面对一件问题时,我们人世根据经验来决策(Learn from experience),而计算机是根据指令进行的(Follow instructions),但是机器可以Learn from data。
第三章:Python机器学习资源
Python机器学习书籍推荐
Python经典书籍推荐,左边入门,右边机器学习原理。
Python第三方包下载地址
针对windows非官方的第三方扩展包下载网站:https://www.lfd.uci.edu/~gohlke/pythonlibs/
Python机器学习常用的包
学习顺序:Numpy –> Pandas –> Matplotlib&Seaborn –> Scipy&Statsmodels –> Sklearn –> TensorFlow&Keras&openCV
- Numpy:关于Python自然科学计算的包,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。https://numpy.org/
- Pandas:是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。https://pandas.pydata.org/
- Matplotlib:Matplotlib 是 Python 的绘图库。https://matplotlib.org/
- Seaborn:和Matplotlib对比Seaborn是Matplotlib的强大的一个扩展。http://seaborn.pydata.org/
- Scipy:是一个开源的数学、科学和工程计算包。https://www.scipy.org/
- Statsmodels:是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。https://www.statsmodels.org/stable/index.html
- Sklearn:Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。https://scikit-learn.org/stable/
- TensorFlow:是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。https://tensorflow.google.cn/
- Keras:是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。https://keras.io/zh/
- openCV:是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库。https://opencv.org/
机器学习知名数据库介绍
加州大学欧文分校提出的用于机器学习的数据库:http://archive.ics.uci.edu/ml/index.php
第四章:监督机器学习算法
线性回归-房价预测
线性回归和误差 (Linear Regression And Error)
误差最小的方程式位置-梯度下降(最小二乘法)
多项式回归
逻辑回归-预测考试成绩是否能被大学录取
Logistic Regression 逻辑回归用于解决二分类问题。
逻辑回归在信用评分卡有几十年应用。
梯度递减。
决策树-APP智能推荐系统
Recommending Apps
朴素贝叶斯-垃圾邮件过滤系统应用
Detecting Span e-mails
SVM支持向量原理
(Support Vector Machine)
什么是margin和hyperplane(超平面)?
Kernel Trick(核函数)
神经网络算法自动玩超级马里奥
第五章:无监督学习算法
kmean-如何选择披萨店地址
K-Means Clustering
层次聚类算法hierarchical clustering
第六章:Python机器学习实战
Anaconda下载和安装
Python第三方包安装
1 | conda install basemap |
Python机器学习实战-泰坦尼克号生存分析
Python信用评分卡-风控信贷守护神
Python风控建模实战
lendingclub-2018年新算法秒杀xgboost
金融现金贷用户数据分析和画像
Python机器学习乳腺癌细胞挖掘
第七章:蒙特卡洛算法
python蒙特卡洛算法与赌博模型
结束语
这个视频实战部分主要是推荐课程的,加上我目前本职工作并不是做Python机器学习的,所以也就没有再往下看。从视频中可以听出来机器学习这一块比较重视数学和算法功底。确实比我这CRUD程序员吊!