一、人工智能的前世今生:1956-2025
人工智能:Artifacial Intelligence,AI
1956年:让机器具备人类智能,AGI,达特茅斯会议
2022年:让机器具备超人类智能(非人类智能),ASI,chatGPT发布
人工智能发展的4个时代
1. 古代(1956-1996):通过规则和知识让机器具备人类智能
2. 近代(1996-2006):通过数据和学习让机器具备人类智能
3. 现代(2006-2020):通过神经网络和深度学习让机器具备人类智能
4. 当代(2020-2025):通过大模型让机器具备人类智能和超人类智能(非人类智能)
二、人工智能0.0:古代(1956-1996),规则和知识时代
第一次浪潮(1956-1968):规则推理
• 思想准备:冯诺依曼计算机、机器思考、图灵测试• 哲学基础:唯理论
• 主要原理:制定规则,进行数理推理(确定性,不确定性的概率)
• 主要成就:下棋程序,定理机器证明,MIT的搬箱机器人
第二次浪潮(1986-1996-?):知识推理
• 哲学基础:唯理论+经验论
• 主要原理:知识工程(知识抽取和知识表达),专家系统(知识库+推理机)
• 主要成就:石油勘探、气象预报、军事决策、经济预测等;包括1996年之后的深蓝国际象棋、Watson
AI=IT:这个时代,人工智能基本等同于软件程序
三、人工智能0.1:近代(1996-2006),机器学习时代
第三次浪潮(1996-?):机器学习(数据+学习),小数据集,特征工程
使用统计学习方法建模,三个核心要素:模型、目标、策略
模型是核心:逻辑回归,决策森林,支持向量机,马尔科夫链,人工神经元……
建模方法从规则到学习:从数学模型(分析数学),到数据模型(计算数学)
数据模型的能力边界:可以用数据模型模拟世界(数字化、全景化),以史为鉴(IID)
主要成就:风险识别(金融、工业、经济)、学术研究
连接主义(1946-2006):神经网络模型(黑盒)
属于机器学习的一种方法,模型采用的是人工神经网络
人工神经网络与人脑最大的共同点是名字(原理、机制和架构并不一样),用神经网络表达数学模型ü 传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..
深度神经网络:深度学习(Hinton,2006)
软件2.0:人工智能是数学、物理学、计算机科学的混合体
四、人工智能1.0:现代(2006-2020),深度学习时代
传统深度学习(2006):深度神经网络模型,中数据集,端到端
多种神经网络模型:DBN,CNN,RNN,ResNet,Inception,RWKV, ……
AlphaGO:2016年超过人类棋手
ImageNet:2017年超过人眼
AlphaFold:2022年超过人类科学家,2024年获得诺贝尔奖
主要成就:人脸识别、图像识别、语言翻译、语音识别、物理建模……
现代深度学习(2017):Transformer模型,大数据集,注意力机制(大规模并行)
三种Transformer模型架构:并行矩阵计算(GPU):堆叠架构,容易扩展
编码器(BERT):embedding,Ernie1.0, ……
混合网络: T5、GLM(早期)
解码器(GPT):生成式人工智能(AIGC),大力出奇迹(大模型,2020)
五、人工智能2.0:当代(2020-2025),大模型时代
模型服务(2020):MaaS
全部是Transformer的GPT架构(解码器):生成式人工智能(AIGC)
大模型:预训练,生成-理解-决策(RL)
大(数据多、参数多、算力多):B级(Billion,10亿)
模型:语言、视觉、多模态p Transformer:大语言模型(LLM,大模型),多模态模型ChatGPT(5、4.1、4o、o1、o3、o4)、Claude;Grok、Gemini;Llama、 ……DeepSeek、Step、Qwen;Kimi、MiniMax;GLM、火山(豆包)、元宝、百度……
Transformer+Diffusion:视觉模型图像: Stable Diffusion、Mid-Journey、DALL.E等视频: Sora、可灵、即梦、Vidu、海螺、veo等
模型:通用模型 vs 垂直模型(行业模型)
接近成熟:传媒、广告、编码、电商等
正在发展:教育、医疗、金融、工业、农业等
六、人工智能2.0:当代(2020-2025),大模型时代
Agent(2025):大模型是新手机,Agent就是app
大模型的应用已从简单的对话工具(chatGPT、豆包)进化为:任务导向、交付结果的Agent(Manus、Lovart、Lovable等)
Agent的核心架构是:感知(多模态)、决策(LLM;记忆、检索、上下文)、动作(具身驱动、工具调用)
Agent的核心特征是自主(请人类走开):从human in loop到human on loop
软件2.0时代
AI0.1(机器学习):小数据,人工特征,部分可解释,不具备通用性和跨模态
AI1.0(深度学习):大数据,特征表示,基本不可解释,不具备通用性和跨模态
AI2.0( 大模型 ):海量数据,自监督学习,完全不可解释,具备通用性和跨模态,最有可能通向AGI的路径
通用人工智能
AGI,Artificial General Intelligence具备与人类同等智能水平或超越人类智能水平的人工智能系统。
OpenAI:在大多数经济价值创造任务中表现优于人类的高度自主系统。
AI肖睿团队:90%的智力任务上超过90%的人类,很可能在2030年之前到来。