2023年,人工智能技术快速发展,以ChatGPT为代表的生成式人工智能逐渐成为全球科技热点。12月16日,国家语言资源监测与研究中心发布2023年度“十大新词语”,生成式人工智能、百模大战位列其中,足见人工智能、大模型等新技术的热度。
在人工智能发展历程中,2023年必将被载入史册。相比前代AI,具备高可用性、高拟人化的预训练大模型跨越技术奇点,国内外技术公司、高校、研究院的语言、图像、视频、音频大模型在2023年以极快的速度相继推出和迭代,基于预训练大模型的应用在全球范围内产生了爆炸式的影响,从社会群众到AI从业者,对人工智能技术能够带来的生产生活变革,都实现了颠覆性的再认识。艾瑞通过技术本身、应用变体、算力支持、政策监管和国际局势五个维度,对2023年AI世界的发展进行全面梳理和俯瞰。
根据艾瑞咨询研究院测算,2023年中国人工智能产业规模已达到2137亿元,大模型带来的底层技术革新将为中国人工智能产业的规模增长带来更多存量扩张与增量空间。2028年,中国人工智能产业规模将达到8110亿元。对比原本大模型未出现涌现能力的人工智能产业规模值,艾瑞测算,大模型带来的产业加成比例在2028年或达到32.9%,在语言语音模态规模加成最为显著。未来大语言模型、语音大模型的产品门槛与应用成本将逐步降低,带来更多API能力调用与产品解决方案的AI能力融入发展,尤其在2024年以后,更多AI产品逐步变现、AI能力下放至边缘侧与端侧之后的影响将更为明显;原本以图像识别为主的计算机视觉市场增长变缓,受政策及政府预算影响,泛安防类的业务增长更多被医疗、工业等CV产品取代,且图像生成市场将在未来3-5年迎来更多商业变现机会,进一步填充计算机视觉模态的市场空间驱力。
2024年2月,OpenAI发布Sora模型,在全球范围内引起剧烈反响。Sora是一个以视频生成为核心的空间模型。它的出现,标志了DiT(DiffusionTransformer)架构的融合成功,且在视觉领域同样可以出现涌现能力,未来持续迭代有望进一步提升视觉模型的生成效果,可喻为视觉生成领域的“GPT 3”时代。此外,随着模型计算规模逐渐增大,模型在物理世界的关键特征、数字和内容的标注理解下,成功建立相应的物理特征与数字关联,具备模拟现实世界中人类、动物和环境,甚至事件生成的能力。因此未来Sora模型不仅可以在影视、医疗、教育等领域提供生产力角色,还能基于对世界空间的认知理解,服务于空间模拟、视频计算、数字孪生等深层需求,成为一款更具通用能力的世界模型。
在应用层,人工智能已深度渗透各行各业,成为革新关键力量。医疗领域,智能诊断、手术助手机器人精准施治;教育中,个性化教学规划激发潜能;工业上,预测维护、智能生产降本增效;交通、金融等行业亦是处处有它身影,正全方位重塑生活与经济格局。
在技术层面,人工智能近年来取得了诸多突破性进展,全方位赋能各行各业。算法领域堪称核心驱动力,深度学习神经网络不断拓展层数、优化架构,让数据挖掘与模式识别愈发精准高效。像是卷积神经网络,在安防监控里,瞬间锁定海量视频画面中的异常行为。算力基建也迎来飞跃,专为AI设计的GPU、TPU芯片大放异彩,性能呈指数级增长。它们能并行处理海量数据,大幅缩短训练时长,过去数月的模型训练周期,如今几天便能完成。数据层面,大数据技术夯实根基,收集、清洗、标注海量样本,喂给AI模型。同时,隐私计算、联邦学习兴起,打破数据孤岛,合规调用分散数据。感知技术更是百花齐放,图像识别精准定位目标,无人驾驶借此看清路况;语音合成高度拟人,智能客服、有声读物有了灵动“嗓音”,这些技术协同联动,掀起行业变革大潮。
在这场由人工智能掀起的科技革命里,我们见证了算法的精妙、算力的飞跃、数据的力量。它不仅革新了传统产业,更激发人类探索未知的无限潜能。AI早已超脱技术范畴,化身时代精神象征——不惧挑战、勇于创新。相信凭借人类智慧与不懈努力,人工智能定能在岁月长河中熠熠生辉,铸就人类文明新高峰。
(审稿人:周箩鱼 撰写人:张新花)