人工智能课程总结

keyword

人工智能

定义:研究从环境接收感知并执行动作的主体。

内涵:思维(Thinking):主体将感知的信息加以处理的过程。交互(Interacting):主体从环境得到感知并作用于外部环境的过程。

应具有的特点是:自主动作、感知环境、处理适当、逐步改善、实现目标。

主体算法(Agent algorithm)是实现一个主体函数的过程。它将感受器感知的信息作为输入,加以处理后生成一个执行器所需执行的动作,作用于外部环境。

思维:

  1. 求解(Solving) :通常称为问题求解(Problem solving),求解依赖于问题。
  2. 规划(Planning) :通过制定策略(Policies)来进行规划,规划依赖于策略。
  3. 学习(Learning) :从数据或环境中学习,故学习依赖于数据。
  4. 推理(Reasoning): 推理基于知识,即推理依赖于知识。

交互:感知和动作

搜索

经典搜索:在一般性回溯法和分支限界法的基础上(ai做评价?)搜索树和图.

优化

元启发式:遗传算法 群体智能:蚁群优化

博弈

决策树 最小最大算法

约束

具有约束条件的搜索问题.

机器学习

针对某类任务T和性能度量P的计算机程序,倘若如度量P所示,它在任务T中的性能随经验E而改善,则被称为从经验E中学习。 是一种归纳式的学习法

可能近似正确学习

为机器学习的有效性奠定了数学基础

没有免费午餐

泛化性越强,针对某一特定数据集的能力较特化训练过的同等模型就越弱

三个视角

学习任务:

  1. 分类(Classification):将输入数据划分成两个以上的已知类别。
  2. 回归(Regression):其输出是连续值而不是离散值。
  3. 聚类(Clustering):将输入数据依据其性质划分为若干个组。
  4. 排名(Ranking):对输入进行数据转换,用它们的排名来代替其输入值。
  5. 密度估计(Density estimation):基于输入的数据找到在某个空间中的概率密度分布函数。
  6. 降维(Dimensionality reduction):将复杂的高维输入数据映射到低维空间。
  7. 序贯决策(Sequential decision-making):根据当前的状态和环境的奖惩来决定下一步的动作。

学习范式:

  1. 监督学习(Supervised learning):采用一组标注数据对算法进行训练,再用训练好的算法对未知数据做出预测。
  2. 无监督学习(Unsupervised learning):仅接收未标注的数据,再对所有的未知数据做出预测。
  3. 强化学习(Reinforcement learning):智能主体与外部环境交互,每个动作得到一个来自于环境的奖惩(reward),再根据当前状态和奖惩值决定下一步的动作。

学习框架:

  1. 概率框架(Probabilistic framework):采用概率来表示随机变量之间的条件相关性。
  2. 统计框架(Statistical framework):将统计学习作为机器学习算法的框架。
  3. 几何框架(Geometric framework):从欧式几何或黎曼几何等概念出发而构建学习算法。
  4. 联结框架(Connected framework):基于联结的思想构建的人工神经网络方式。 神经网络
  5. 逻辑框架(Logical framework):采用逻辑或规则方法构建学习算法。
  6. 决策框架(Decision-making framework):用于序贯决策的马尔科夫决策过程。

讨论

决策树的训练过程是一棵生长的树,引发了我的一些思考. 决策树的分类过程和人分类的过程是相近的,在决策树的训练过程中,算法会根据数据集中的特征和标签来构建树的结构。每个节点代表一个特征,每个分支代表一个特征值,每个叶子节点代表一个类别。这个过程就像是人类在做分类决策时,会根据不同的特征和条件来做出选择一样。

例如,假设我们要对动物进行分类,我们可能会首先根据动物是哺乳动物还是非哺乳动物来进行分类,然后再根据其他特征,比如体型、食性等来进一步细分。决策树的训练过程也是这样,它会根据数据集中的特征来进行分裂,直到达到一定的停止条件,比如叶子节点中的样本数量达到一定阈值或者纯度达到一定标准。

决策树的训练过程是一种自上而下的、分而治之的过程,它模拟了人类在做分类决策时的思考过程,通过不断地对特征进行划分,最终得到一个能够对数据进行有效分类的模型。

区别只在于,人具有主观能动性,可以逐渐去获得新的信息去更细的完成这个分类任务,是否可以设计一个无监督学习的决策树,获得新的输入特征只需要在现有的根节点旁建一个兄弟节点并设立一个新的根节点.

机器学习近些年发展得越发强大,以transformer模型为基础的gpt模型更是当中的佼佼者,尤其是openai的gpt4,已经能够归纳稍微复杂的语言规则并进行简单的演绎了,而它能够归纳一篇我自己在一门选修课上原创的一篇小说并清楚其内涵和立意,更是让我震惊.而使用clip模型,图像和语言之间的桥梁也被建立,人工智能领域最伟大的两个成果之间产生了联系,使之后的ai应用已经和真人无异,图灵测试也已经不再是难题.我认为,得益于自然语言和图像的不确定性,神经网络在这方面展现了其无比的优势,但gpt也终究只是一个预测的模型,它认识不到自我的概念.好比数字'1',我们都知道'1'是一个抽象的概念,它可以指代1个细菌,也可以指代1颗星球,可以指代1根棍子,也可以指代1个城市.这并不是语言的不确定性导致的,在上述每个例子中,'1'的含义都是清晰的.但是对于GPT这样的模型来说,它虽然能够理解'1'在不同语境下的不同指代的表面,但它并不能真正理解'1'背后的抽象本质和它所代表的实体的真实存在。它只是根据大量的数据和算法来预测'1'在特定语境下最可能的含义。因此,尽管GPT模型在处理语言和图像方面取得了巨大的进步,但它们仍然缺乏对现实世界的真正理解和自我意识。生命的来源是复杂和不确定性,神经网络和生命的距离还有多少呢,是否只差一个'1'呢.