1、intro
自然语言处理虽然我们过去取得了很大的进展,但是实际上还是停留在感知层面。
计算机视觉领域,因为图片里面都是像素,像素很难用符号学来解释,所以计算机视觉大部分是用概率模型或机器学习来做。
深度学习它是机器学习的一种,但是它是能做计算机视觉、自然语言处理等等
2、深度学习在应用上的突破
上图表示,从10年到17年,图片分类错误率显著下降的一个发展情况图,2012年有一个比较大的下降,是因为这是深度学习的开始,接下来5年,深度学习的发展已经将图片分类的误差降到非常非常低的一个水平了。
物体检测是说,通过机器去找某一个物体在图片的哪一个位置,而物体分割是指,每一个像素到底是属于这个飞机还是这个人,这是特别深层次的一个应用。
这里是给出像素风格,然后把原始图片转换成给定风格的修正图片。
这里是人脸合成,人类是很难识别出这些人是真的还是假的,但这些脸的确都是假的()。
这里提到的GPT3,
这里是Tesla的无人驾驶技术
最后详细介绍一个案例:广告点击
左边这个图是在搜索框里搜baby toy,下面会弹出很多广告,这就是一个问题:
给出一行文字描述,下面要弹出哪些广告内容?
之后可以根据广告的点击率和竞价去把广告进行一个重新排序,排序高的放在前面。
里面最重要的就是一个机器学习模型:特征提取和模型预测
QA:
1.模型的可解释性一直是机器学习和深度学习非常关心的,因为大家都知道这是一个黑盒模型,你训练了一个模型,你不知道它为什么工作或者为什么不工作,对于深度学习来讲这一块做的是不好的,对于机器学习来讲,我们对简单的模型有一些理解,但是变得很深的时候我们是放弃这一块的。为什么有效和可解释性是两个事情,所有模型提出来的时候我们都会说为什么有效,但是可解释性是另一块,这涉及人是不是理解这个模型,就是它什么时候不工作,在什么地方会出现偏差等等,后面讲模型的时候会讲到可解释性的内容,比如什么时候要用到空间信息,什么时候要用到时间信息balabala
2.领域专家可以认为是甲方,是提需求的一方,而数据科学家是乙方。
3.我们这个课程是基于PyTorch,mset(这里我不懂+没有听清)安装了GPU版本需要把CPU版本卸载
4.深度学习模型我们可以用数学来表示,但是我们用数学来解释一个模型为什么工作为什么不工作,这个我们是解决的不好的。
5.符号学适用于推演,目前来说比如GNN图神经网络,可以做一些比较复杂的推理的过程,目前在模型够复杂的情况下,确实可以做一些推理的工作
7.Mac可以做PyTorch,但是仅仅可以跑CPU,复杂任务不太能跑。
9.如何寻找自己领域的paper:(现在其实可以通过AI去找paper)后面会分享自己的做法