
10月22日,“2024百度十大科技前沿发明”发布会举行,在本年的十大前沿发明中,大模子已成为产业创新妥协锁新质坐褥力的遑急握手,AI原生应用正在融入坐褥生计的方方面面。百度首席工夫官(CTO)王海峰暗示,前沿发明不仅扶持百度普及了自有产物、业务效果和效率,也为百度产物AI原生化重构,为东说念主工智能赋能千行百业孝敬了力量。百度发布十大发明,一方面,通过赏赐这些引颈产业创新的前沿恶果,饱读动更多的创新创造;另一方面,股东产业界更多应用这些恶果,加速产业化进度。
“早在2017年,百度就驱动探索和参谋大模子工夫,并进一步冲破基于想考模子的智能体工夫,拓展了大模子的智商界限,促进大模子应用爆发。”王海峰说说念。

如今,东说念主工智能与实体经济加速交融,我国完备的产业体系为东说念主工智能工夫提供了弘大应用舞台,股东产业转型升级,成为科技改进和产业变革的关节力量。百度集团专利事务部总司理崔玲玲发布“2024百度十大科技前沿发明”。据先容,百度东说念主工智能领域的前沿专利发明,涵盖了从基础算法到应用场景的全地点冲破,正引颈着AI产业新的变革,咱们但愿附近加速专利工夫的产业化进度,以此股东千行万业的智能化升级,从而促进经济高质地和可连续的发展。
自2013年入局AI领域,百度一直对峙压强式、马拉松式的研发干与,近十年累计研发干与近1700亿元。扫尾2023年底,百度在东说念主工智能全领域专利苦求量19308件、授权量9260件,连气儿六年位居国内第一;在以大模子为中枢的新一代AI领域,百度专利苦求1432件、授权651件,成为工夫创新和专利布局领军者。笔据专利数据库机构IFIclaims发布的生成式东说念主工智能专利图景知悉,百度生成式东说念主工智能专利苦求量踏进寰球TOP10,专利工夫涵盖文本、图像、语音、视频四大基础领域,成为这四个领域全面布局的寰球四家公司之一。
百度2024十大科技前沿发明,具体如下:
一、基于生成式大模子的智能体工夫
该发明工夫创新性地引入了想考模子,使智能体具备了任务盘算、器具调用、常识增强和反想进化等多重智商。通过系统化的遐想与中枢智商的定向优化,或然低资腹地扶持不同应用场景下智能体的范围化缔造与部署;通过缔造大规师法真智商,加速智能体构建与分发。该工夫系统已告捷应用于文心智能体平台、商家智能体、文心快码等多个要点场景,显耀普及了智能体的研发效率,裁汰了研发门槛。
其中,商家智能体通过盘算+内行的多模子协同工夫和大规师法真工夫,普及反想、进化和使用器具的智商,构建AI营销智商;文心快码依托代码保举和智能体系统,与传统DevOps器具链有机纠合,股东东说念主机协同结对编程的深度探索与落地。
二、基于大模子高效检修框架的多模子协同进化工夫
该发明工夫从工程和算法两个角度攻克系列难题。工程架构上,从夹杂并行战略、通讯效率、计较存储优化全地点创新冲破,显耀普及废话语模子检修性能,撑持文心全系列模子全过程高效走漏检修。算法战略上,研发了大小模子协同的预检修工夫,攻克了模子间常识难以剿袭的工夫难题,蜕变了传统模子的检修范式,裁汰了新模子检修资本。
基于该发明构建了各范围模子的工夫壁垒,使文心大模子检修隐晦速率在畴昔一年普及了4.1倍,扶持文心一言高效餍足不同需求的平素业务,赋能千行万业。
三、基于大模子和常识检索增强工夫的多模态推行创编一体的智能系统
本发明工夫概述欺诈常识增强、多源推行解析、交融式剪辑、检索增强文生图等工夫,处治了专科长文及多模态推行生成质地弱、创编无法分享容器、文生图主体准确性差等问题。检索增强文生图,旨在通过智能判断用户需求自适当处理参考图,进而基于夹杂模态的生图系统显耀普及了生图主体的一致性,灵验弥补长尾推行描述不准确的短板,举座效果远远向上文生图原生系统。
百度文库仍是在基于用户领导及上传推行及时生成行业研报、演示文稿、想维导图、画本漫画并扶持一站式剪辑、跨模态转机、通用/个性化生图等复杂任务方面取得了显耀的效果普及。
四、扶持范围化的自动驾驶定位和车说念级舆图生成工夫
该发明工夫冲破了传统步地的效率和资本问题,裁汰了舆图制图资本95%,车说念级说念路里程向上360万公里,完竣世界向上41000个城州里说念路的全秘密。基于舆图数据进一步构建的多模态传感器交融的自动驾驶高精定位工夫,精度达到厘米级,极大提高了可量产性,将车端定位依赖的舆图包体积裁汰97.5%,可靠性达到99.9999%,全面撑持现在萝卜快跑全无东说念主驾驶的范围化运营,在高架桥下、多层路、纯正等千般复杂贫困场景完竣全无东说念主驾驶。
五、面向大模子智能化的个性化缅想机制
该发明工夫创新性地提议了一套全面的缅想机制,涵盖缅想加工、存储、管制、触发和利用五大模块,赋予大模子个性化缅想智商。缅想加工模仿东说念主类海马体机制,完竣了对全场景用户信息的深度连气儿和精确加工;缅想管制扶持用户主动与系统自动地增改削查,确保了缅想库的及时更新与准确;缅想触发和利用,通过干系缅想的测度生成,辅助大模子产生愈加拟东说念主和个性化的回话。该发明工夫已平素应用于智能AI助手、数字东说念主等场景。
六、基于大模子的超拟真数字东说念主建模、驱动与生成系统
该发明工夫提议了一整套的超拟真数字东说念主建模、驱动和生成决策。针对真东说念主数字东说念主,研发了数据驱动的东说念主像建模、跨模态驱动和东说念主像视频生成大模子,完竣了当然、拟果真数字东说念主推行坐褥,独家扶持大幅当作&遮拦场景的直播东说念主像克隆,并完竣了首个全身智能驱动直播间落地。针对超写实3D数字东说念主,基于文心大模子研发了模态移动和多智能体互助工夫,完竣了分钟级制作忘形影视大片、3A游戏的超写实数字东说念主形象及运营推行。本发明工夫已平素地应用于数字东说念主直播、视频坐褥、智能体等繁密真东说念主和3D数字东说念主的产物中。
七、基于大模子的生成式买卖检索系统
该发明工夫变革了传统的 “索引-调回-排序”过程,扁平化系统漏斗,减少信息亏损,通过构建索引学习任务,将买卖信息编码进模子参数,完竣“模子即索引”,利用大模子的连气儿和推明智商,完竣“生成即检索”,新范式显耀普及系统定向效率120%。该发明所触及样式业界最初落地,完竣大范围工业化应用,生成式大模子纠合买卖搜索场景取得多项工夫创新,创意丰富度普及37倍,创意质地普及92%,取得了显耀的业务收益和平素工夫影响力。
八、大模子数据飞轮工夫
该发明工夫通过整合用户响应、膨大响应和自监督响应等多开头和形势的信息,自动识别模子劣势并高效合成高质地、千般化的检修数据。同期纠合多源响应的强化学习形势,显耀普及了模子检修效果。该创新工夫构建了一个或然连续自我校正的数据飞轮,灵验冲破了大模子的数据瓶颈,裁汰了数据获取资本,提高了大模子的适当性和鲁棒性,普及了模子在不同任务场景下的泛化智商,加速大模子连续进化。
九、大模子高效推理工夫
该发明工夫提议的高效推理工夫,底层模子层基于飞桨框架,在推理架构主义,纠合主流的PrefixCaching、Lookahead、PagedAttention、PD分裂等主义连续创新,并将各项工夫高效纠合,大幅普及模子隐晦和性能。在大模子压缩方面,收受大模子无损量化工夫,通过激活自适当分段平滑与权重联动重排等形势,在业内最初完竣了对百亿千亿级大模子的高效无损压缩。该发明扶持多种大模子压缩和推理加速技能,现在已应用于百度智能云千帆大模子平台等中枢业务,减少模子推理的资源破费,自便大模子部署资本超50%,普及模子性能,模子隐晦普及3~5倍。
十、用户数据响应驱动的检索生成系统
该发明工夫提议的检索生成系统开云(中国)Kaiyun·体育官方网站-登录入口,或然纠合用户行动响应信号,完竣快速自我强化。通过惬意度建模和强化学习凯旋对都用户偏好,并利用用户响应触发系统快速反想,处治了传统数据应用时内行响应效率低和用户偏好建模难的问题。基于该框架的检索生成系统已秘密18%的搜索流量,平素应用于翰墨、视频、图片等搜索场景。多元用户响应的范围大、可轮回的特质,使系统或然快速适当数据、产物和环境的变化,匡助系统自动化寻优,加速系统向盼愿现象演进,具备极高的实用价值和商场竞争力。