前言
本文章是拨珠自己的学习笔记,自用为主,学习请移步专门教程,若有错误请大佬轻喷,也欢迎同好交流学习。
本文将阐述三个问题。
什么是机器学习?
监督学习、无监督学习到底在干什么?
分类、回归、聚类又是怎么回事?
一、一句话说清:机器学习是干什么的?
想像你养了一只小狗。
第一次,你把飞盘扔出去,小狗不知道要去捡。
你反复示范、奖励,它慢慢学会“看到飞盘→跑过去→叼回来”。
机器学习就是让电脑像小狗一样,通过“大量练习(数据)”自己学会一套规则,以后遇到新问题也能做出正确反应。
二、三个关键词:人工智能、机器学习、深度学习
用“套娃”来理解:
人工智能(AI):最大的套娃,目标让机器像人一样聪明。
机器学习(ML):实现AI的一种方法——让机器自己从数据里“练级”变强。
深度学习(DL):机器学习里的一个“大招”,用很深的神经网络处理图像、语音等复杂任务。
三、机器学习的四大门派
门派 | 通俗解释 | 举个栗子 |
---|---|---|
监督学习 | 老师带着练:题目+标准答案一起给 | 给1000张“猫/狗”照片并告诉你每张是猫还是狗,让电脑学会辨认新照片 |
无监督学习 | 自学:只给题目,不给答案 | 给你一堆用户购物记录,让电脑自己把“相似购物习惯”的人分成几组 |
半监督学习 | 少数老师+多数自学 | 100张带标签的猫狗照 + 9000张没标签的照,一起学 |
强化学习 | 试错升级:做对奖励,做错惩罚 | AlphaGo跟自己下围棋,赢了加分、输了扣分,越下越厉害 |
四、监督学习:有标准答案的练习册
分类问题(答案是一个类别)
例:邮箱收到新邮件,系统判断是“垃圾邮件”还是“正常邮件”。
再例:花瓣长5cm→大概率是“B品种花”。
回归问题(答案是一个数值)
例:根据房子面积、地段来预测“房价是多少万元”。
再例:根据往年降雨量预测“明天河流水位会涨到多少米”。
五、无监督学习:没有答案,自己找规律
最常见的是聚类(把相似的东西放一堆)。
例:
把一堆花瓣按“长度+宽度”画在坐标纸上,人眼都能看出两团点,电脑也能自动分成“很可能是两种花”。好处:
给数据打好“疑似标签”后,人类再去确认,比人工一张张标省事多了。
六、一张图秒懂整体流程
原始数据 → 无监督学习先分堆(节省人工标注) → 得到带标签数据 → 交给监督学习模型训练 → 模型上线做预测
七、小结
机器学习 = 让电脑用“数据练习”变聪明。
监督学习:有答案,学“做题套路”。
分类:答案是一类。
回归:答案是一个数。
无监督学习:没答案,自己找“谁和谁像”。
深度学习:机器学习里用“多层神经网络”的大招。