收起左侧
发新帖

人工智能,从深度学习到全面赋能(科技前沿)

时间:2025-2-26 20:45 0 52 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x


《讽刺与幽默》供图






近10年来,以深度学习为主要技术路线的人工智能(AI),从判别(如图像、文字、语音识别等)到生成(如文本、图像、视频、程序等)接连取得突破,DeepSeek、ChatGPT、Sora等应用展示多种技术可能。作为革命性通用技术,人工智能正加速融入人们的日常生活、生产工作和学习研究之中,推动人类经济社会信息化进程迈向智能化的新阶段。
发展新阶段:从判别到生成,从单模态到多模态,从专用到通用
人工智能作为近年来科技领域最热门的话题之一,其实并不是一项新技术。早在1956年,人工智能的概念就在美国达特茅斯学院召开的夏季研讨会上被提出。此后经历半个多世纪发展,都未能实现真正的实用化。2012年,加拿大多伦多大学教授杰弗里·欣顿和他的学生基于机器学习提出的深度学习神经网络模型,在图像识别挑战赛上取得重大突破,激发AI领域的又一次发展热潮,推动语音识别、图像识别以及自然语言处理等多个领域快速进步。
AI技术不断迭代升级。特别是2022年前后,生成式人工智能迎来全面爆发。2022年11月,美国OpenAI公司推出ChatGPT,以更大规模的模型实现了更强的内容生成(AIGC)功能。2024年2月,OpenAI公司推出的文生视频大模型Sora,推动生成式人工智能从只能理解单一形式信息(比如文字、图片、音频等)的单模态,迈向可以同时理解多种形式信息(比如图片和文字)的多模态。与此同时,全球的AI大模型竞相超越又各有特长,国外谷歌的双子座(Gemini)、安索皮克(Anthropic)的克劳德(Claude)、元公司(Meta)的Llama,中国的文心一言、智谱清言、豆包、书生·浦语、星火认知、360智脑、通义千问、混元、Kimi、零一万物等,形成百花竞放的局面。
2025年1月,我国人工智能企业深度求索(DeepSeek)推出新模型DeepSeek—R1,凭借技术创新和商业化潜力引发全球瞩目。这不仅是因为该模型在自然语言处理方面表现卓越,更为重要的是其在训练方法上实现了创新,成功降低了同类产品对算力资源的大量需求,显著降低了使用成本。得益于此,用户可将R1部署在个人本地设备,实现更为安全且个性化的服务。尤为重要的是,DeepSeek的开源模式为全球创新发展带来新机遇,并有可能带动全行业在未来形成以开源为主流的发展路线。
从判别到生成,从单模态到多模态,从专用到通用,是智能化发展新阶段的重要标志。人工智能以自然语言为基础的表达方式,正从方方面面渗透进大众生活。从手机应用、智能音箱等智能助手,到智能网联车和智能机器人等具身智能,再到能提供个性化服务的智能体以及更多的AI原生产品和服务,正加速向我们走来。
核心驱动力:计算机能够从数据中学习规律并做出预测或决策
机器学习是指通过数据训练模型,使计算机能够从数据中学习规律并做出预测或决策。作为当下AI发展的主流技术路线,这条路线让机器通过学习而不是靠预设规则来获得智能,体现了学习是智能形成和发展的本质。可以说,生物智能也好、机器智能也好,都离不开学习,所有的成功和突破都源自学习。“生而知之”毕竟是极少数天才的特质,“学而知之”才适用于大多数人。人类在发展人工智能时也采用了学习的路线。
机器学习主要通过神经网络实现。神经网络作为机器学习的一种具体模型,就是通过模拟人脑的结构和功能来处理数据。人类大脑是由神经元和突触构成,神经元通过突触传递信号,实现信息处理、学习和记忆等功能。人工神经网络模拟这一结构,利用集成电路芯片组成的电子计算系统,采用人工神经元和连接(即模型参数)代替生物神经元和突触,通过输入数据、调整权重来学习和预测,构成了AI的物质底座。
正如人脑层数越多,处理复杂信息的能力就越强,神经网络也同样需要更多的层数,这就需要借助深度神经网络。以深度神经网络构建的深度学习系统即为AI“模型”,这类模型的参数越多,就意味着模型越大,性能越强。例如,GPT—3模型实现了千亿量级参数,GPT—4模型参数甚至达万亿量级。
简而言之,机器学习是人工智能的核心驱动力,它通过从海量数据中提取有价值的信息,帮助人类做出预测、判断和生成所需的内容,从而提升任务处理效率,将人力从繁重、重复、低级和危险的劳动中解放出来。2024年的诺贝尔物理学奖颁给了约翰·霍普菲尔德和杰弗里·欣顿,以表彰他们通过人工神经网络实现机器学习的基础性发现和发明。展望未来,机器学习通过不断发展,必将为人类社会带来更大惊喜。
更广泛运用:AI智能体可望成为今年发展应用亮点
2025年将是AI走向更广和更深应用的关键之年,AI智能体(或称AI代理)可望成为今年AI发展应用的亮点。AI智能体可以说是人工智能技术的集大成者,具备自主性、感知能力、决策能力和行动能力等显著优势。它能够通过理解交办的任务、感知相应的执行环境,进而自主调用相应的智能模型功能、采取相应的行动,可以广泛应用于工业、医疗、交通、金融和家庭等领域。每个用户可能有多个AI智能体帮助解决各种需求,它们有的像是秘书,有的像是工匠,有的像是医护,有的像是采购员,有的像是清洁工。
例如,某公司计划设计一个活动邀请系统,在将活动时间、地点和主题等信息准确传达后,AI可自动生成一个智能体“小组长”,负责整体规划和调度。小组长可以召唤多个执行不同具体任务的智能体,1号智能体负责活动邀请函的策划,2号智能体负责设计邀请函中的图像及文字,3号智能体负责代码制作和部署网页,4号智能体负责检验差错,他们就像是一个“工作专班”,成为完成个性化工作的“群体智能”。
通过AI智能体,各种AI技术将会被更方便、更广泛、更有效地应用起来,将在多个领域引发根本性变革。同时,快速发展的“科研智能”正在形成科学发展的新范式,为科技这一第一生产力的发展赋能,意义深刻而长远。在这个日新月异的智能时代,学会应用AI技术也将成为多数人的必备技能,人们需要学会以有效而适当的方式运用AI助益工作和生活。
“两岸猿声啼不住,轻舟已过万重山。”随着AI在生命科学、物质科学、数学、工程技术等领域的应用日益广泛和深入,可以预见,正如历史上机械动力和电气技术极大拓展了人类的体力劳动能力一样,AI正在加速拓展人类的脑力劳动能力,推动生产力实现又一次质的飞跃,并对人类社会的发展进步产生全面而深远的影响。
在AI先进生产力驱动的社会智能化历史进程面前,人类要把握和主导自身的命运,就必须提升自身的智能化能力,学会驾驭AI。各方应努力让AI行驶在促进经济繁荣和环境保护、保护公共利益和个人隐私、遵守法律法规和伦理良俗、促进公平正义与包容和谐的轨道上,确保AI造福全人类的可持续发展。
(作者为中国新一代人工智能发展战略研究院执行院长龚克)
链接
AI同学,请回答
网友问:什么是深度神经网络?可以通俗易懂地介绍一下吗?
DeepSeek:
深度神经网络(DNN)是一种模仿人脑神经结构的机器学习技术,专门处理复杂数据。你可以把它想象成一个“多层级加工厂”:比如识别猫的照片,第一层先看像素点,第二层组合成线条,第三层拼出猫耳、胡须等特征,最后一层综合判断这是猫。每层由大量“神经元”(数学计算单元)组成,层与层之间通过可调节的“连接强度”传递信息。
它的核心能力在于自动学习特征。传统算法需要人工设计规则(比如,先找边缘、再识别形状),而DNN能通过海量数据自己发现规律。训练时就像教小孩认字:先猜结果,对比正确答案,再反向调整各层神经元的计算参数,经过数万次迭代后越来越精准。
这种结构让它在图像识别、语音翻译、自动驾驶等领域表现突出,尤其在处理非结构化数据(图片、文字)时远超传统编程。但前提条件是需要大量算力和数据,模型内部决策过程也像“黑箱”一样,难以完全解释。
专家点评:
深度神经网络的强大特征提取能力,与其网络结构与规模分不开。根据通用逼近定理,只要神经元及其连接的数量足够大,就可以逼近任意复杂的连续函数。而这些数量巨大的“参数”,是通过训练(学习)来确定的。相信随着网络结构和训练方法的持续创新,深度神经网络的能力还可继续提升。
网友问:我们应该如何理解大语言模型这个概念?别太复杂。
通义千问:
大语言模型可以理解为一个“超级聪明的文字助手”,它通过学习海量的文本数据,掌握人类语言的规律和知识。你可以把它想象成一个读过无数书籍、文章、网页的“大脑”,它知道怎么回答问题、写文章、讲故事,甚至还能编程、翻译、聊天。
它的核心能力是预测下一个词。比如你输入一句话的开头,它会根据上下文猜测接下来最可能说什么。通过这种方式,它能生成连贯、自然的文字。而且,因为它学了很多知识,所以不仅能回答简单问题,还能处理复杂的任务,比如分析逻辑、总结长文或者模仿某种写作风格。
不过,大语言模型并不是真正“理解”文字,它更像是在模仿人类的语言模式。它没有感情,也不会主动思考,只是根据输入的内容给出最合适的回应。所以,有时候它的答案可能看起来很合理,但其实是错的,这就需要我们去判断和核实。
专家点评:
大语言模型不仅网络规模庞大,还采用一个重要的技术即“词嵌入”技术。该技术将自然语言的“词”嵌入到多维的语义空间,表达为“语义矢量”,从而可以对“词”进行计算,由此可以跨越语言的形式(如英语、汉语,文本、图像等),生成各方面内容。大语言模型的突破推动了人工智能几乎所有(应用语言)领域的应用,但也面临生成偏差、算力消耗、伦理风险等挑战,需结合人类监督与技术优化以实现安全可控的发展。
(专家为中国新一代人工智能发展战略研究院执行院长龚克)
《人民日报》(2025年02月26日16版)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部