百度大脑是百度 AI 核心技术引擎,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。百度大脑对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速AI技术落地应用,赋能各行各业转型升级。
百度大脑是百度 AI 核心技术引擎,包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台。百度大脑对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速 AI 技术落地应用,赋能各行各业转型升级,并通过百度智能云赋能行业客户。
2019 年 4 月 20 日,“百度大脑核心技术及开放平台”荣获 2018 年度中国电子学会科学技术奖科技进步奖一等奖。2019 年 7 月 3 日,在 2019 年百度 AI 开发者大会上,百度 CEO 李彦宏透露,迄今为止百度大脑已经向所有开发者开放了 200 多项 AI 核心能力。
百度大脑概述
百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台,对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速 AI 技术落地应用,赋能各行各业转型升级。
2016 年百度世界大会,百度大脑 1.0 完成基础能力搭建和核心技术初步开放;2017 年百度 AI 开发者大会,百度大脑 2.0 形成了完整的技术体系,开放 60 多项 AI 能力;2018 年百度 AI 开发者大会,百度大脑 3.0 核心技术突破为“多模态深度语义理解”,同时开放 110 多项核心 AI 技术能力。
百度大脑已对外开放了 150+项领先的 AI 能力,构建起 AI 全栈技术布局。未来百度将继续平等赋能开发者,让每一位开发者都能平等便捷地获取 AI 能力。
发展历程
以搜索业务为核心
2000 年 1 月,百度作为一家搜索引擎公司诞生在中关村。搜索引擎的背后,除了有链接分析等互联网技术,还需要自然语言处理、信息检索等 AI 技术,因此,百度从诞生之初,就开始了人工智能技术研发与应用。
全面布局 AI 基础技术
2010 年初,已经有了 10 年技术积累的百度,开始全面布局人工智能,陆续开始了包括自然语言处理、机器翻译、语音、图像、知识图谱、机器学习、数据挖掘、用户理解等技术的研发。
2012 年 1 月,百度开始研发深度学习技术,并于当年上线语音识别和图像识别能力,大幅提升了识别效果。正是由于看到了深度学习在应用中的惊艳效果,百度在 2013 年初成立了世界上第一个深度学习研究院。
2013 年下半年,百度在世界上首次将深度学习技术应用于大规模搜索排序系统。2015 年,百度上线了世界上首个大规模神经网络机器翻译系统,比 Google 早了一年多时间。
对外开放 AI 核心能力
2016 年 9 月的百度世界大会上,基于百度 16 年的深厚积累,百度大脑正式发布,同时宣布对外开放百度 AI 核心技术。
2017 年 7 月百度 AI 开发者大会上,百度大脑 2.0 正式公布包含基础层、感知层、认知层和平台层在内的完整技术布局,并通过 AI 开放平台对外开放包含语音、图像、视频、增强现实、自然语音处理等在内的 90 余项 AI 核心能力,积极与行业合作伙伴和广大开发者一起共建 AI 技术生态。
2018 年 7 月百度 AI 开发者大会,百度大脑宣布升级至 3.0,开放 110 多项核心 AI 能力,并公布百度大脑每日的调用次数已超过 4000 亿次。百度大脑 3.0 的核心技术突破是“多模态深度语义理解”,不仅让机器听清、看清,更可深入理解其背后的含义,从而更好地支撑各种应用。
2019 年 7 月 3 日,在 2019 年百度 AI 开发者大会上,百度 CEO 李彦宏演讲开场。李彦宏透露,百度大脑作为一个拥有全体系 AI 能力的技术平台,迄今为止已经向所有开发者开放了 200 多项 AI 核心能力,这些能力和开发者结合起来,就会产生魔幻一般的力量。“星火燎原,AI 一定会在各行各业产生越来越大的价值。”
百度大脑核心 AI 技术
1、深度学习
深度学习是人工智能(AI)最热门的研究领域之一,已经成为引领人工智能持续突破的关键技术。
技术研发方面,12 年,百度开始研发深度学习技术,并于当年上线语音识别和图像识别能力。2013 年,百度成立深度学习研究院。2017 年,由中华人民共和国国家发展和改革委员会批复,百度牵头筹建了国内唯一的深度学习技术及应用国家工程实验室,百度以“领头雁”身姿引领中国深度学习核心技术研发。
能力开放方面,2016 年,百度正式宣布对外开放 PaddlePaddle,它是国内最早开源、也是当前唯一一个自主研发功能完备的深度学习平台。依托百度业务场景的长期锤炼,PaddlePaddle 具备了最全面的官方支持的工业级应用模型,支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,拥有强大的多端部署能力。18 年 PaddlePaddle 3.0 版本正式发布,升级为全面的深度学习开发套件,除了核心框架,还开放了 VisualDL、PARL、AutoDL、EasyDL、AI Studio 等一整套的深度学习工具组件和服务平台,更好地满足不同层次的深度学习开发者的开发需求,具备强大支持工业级应用的能力。
百度大脑 AI 技术成果
2018 年 2 月,美国权威杂志《麻省理工科技评论》(MIT Technology Review)揭晓了 2018 年“全球十大突破性技术”(10 Breakthrough Technologies 2018),在官方榜单中,百度被列为实时语音翻译领域“关键玩家”,成为本年度唯一一家入选的中国公司,也是史上首个连续三年入选该榜单的中国公司。
2018 年 2 月,百度自然语言处理(NLP)团队研发的 V-Net 模型以 46.15 的 Rouge-L 得分登上微软的 MS MARCO(Microsoft MAchine Reading COmprehension)机器阅读理解测试排行榜首。百度 NLP 在 MARCO 提交的 V-NET 模型,使用了一种新的多候选文档联合建模表示方法,通过注意力机制使不同文档产生的答案之间能够产生交换信息,互相印证,从而更好的预测答案。此外,此次百度只凭借单模型(single model)就拿到了第一名,并没有提交更容易拿高分的多模型集成(ensemble)结果。
2018 年 3 月,百度凭借全新的人脸检测深度学习算法 PyramidBox,在世界最权威的人脸检测公开评测集 WIDER FACE 的“Easy”、“Medium”和“Hard”三项评测子集中均荣膺榜首,刷新业内最好成绩,超过了国内外众多科技公司和高校实验室,这也是继 2015 年提出 DenseBox 算法之后百度再次刷新人脸检测纪录。
2018 年 4 月,以“大数据+”为主题的第十三届中国电子信息技术年会在苏州召开,百度知识图谱荣获 2017 中国电子学会科技进步一等奖。
2018 年 6 月,百度视觉技术团队凭借领先的图像识别和视频理解技术在全球两大视觉竞赛 WebVision 和 ActivityNet 中分别击败 100 多家参赛单位和队伍,获得多项世界第一,并受邀在全球视觉技术领域顶级学术会议 CVPR(IEEE 国际计算机视觉与模式识别会议)上做报告分享。
2018 年 9 月,百度视觉团队在最大规模目标检测竞赛 Google AI Open Images-Object Detection Track 中再获佳绩,击败了全球 450 多支参赛队伍,脱颖而出获得世界第一,并受邀在顶级视觉学术会议 ECCV2018 上做分享。
2018 年 11 月,人工智能顶级峰会 NIPS 八大挑战赛之一 AI for prosthetics Challenge(人工智能假肢挑战赛)已经决出胜负,百度击败来自全球 400 个技术团队夺得冠军,其 9980 分的高分,足足领先第二名高达 30 分之多。据媒体报道,此次挑战赛是通过强化学习算法,来实现对人类骨骼仿真模型的训练,使模型能最大限度模仿人类运动方式,从而实现人工智能与生物科技的真正结合。
NeurIPS 是人工智能和机器学习领域的国际顶级会议,百度数篇学术论文入选 NeurIPS 2018。百度大数据实验室于当地时间 2018 年 12 月 2 日组织了一场主题为《Common Model Infrastructure》的 Workshop,邀请了来自谷歌、微软、XPrize 的研究者,就自动机器学习这一专题进行分享,百度方面也介绍了自己在这方面的研究成果。
AAAI 是人工智能领域的国际顶级会议,早期由计算机科学和人工智能创始人 Allen Newell, Marvin Minsky 和 John McCarthy 等人首创,被中国计算机学会(CCF)推荐为 A 类会议。百度共有 15 篇论文被人工智能顶级学术会议 AAAI 2019 收录,多位百度科学家、研究者受邀将赴会作报告。
2019 年 2 月,第十三届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2019)论坛评论建议挖掘任务评测(Task 9A: Suggestion Mining from Online Reviews and Forums)中,百度一举击败来自全球的 210 余支队伍,最终以 F 值 78.12%的成绩夺得冠军,再次印证了百度在语义理解等核心技术的世界领先地位
百度大脑 AI 开放平台
百度 AI 开放平台持续升级,是最完整、最前沿、最开放、最具活力的 AI 技术平台。现阶段从深度学习框架、深度学习实训平台、场景化 AI 能力、定制化训练平台,到软硬一体模组和解决方案等实现全面开放,为各行各业赋能,加速创新 AI 产品落地,助力企业智能化转型。
百度 AI 开放平台上的开发者数量超过 100 万,加入燎原计划的合作伙伴超过 300 家,入选百度 AI 加速器企业覆盖金融、工业、农业、零售、医疗、互联网等 17 大行业。
百度大脑落地及应用案例
百度大脑持续不断地开放,让越来越多行业和企业变得越来越智能,借助 AI 提升效率,创造新价值。百度 AI 能力已被广泛应用于医疗、零售、金融和安防等不同领域,让任何人在任何地方,都能通过百度平等获取顶尖的 AI 能力。
1、第一产业
农业遥感无人机
辽宁盘锦的农民张玉军,通过使用百度与麦飞科技合作的农业遥感智能监测系统,引入边缘计算,对农作物病虫害实施智能化监测,并完成精准施药,能够将农药使用量降低 50%。百度正利用 AI 能力让农业生产提质增效,“打好中国粮,端好中国碗。”
利用 PaddlePaddle 搭建智能桃子分拣机
北京工业大学的 4 位学生利用百度 PaddlePaddle 开源平台上的深度学习模型,用这些大桃照片,通过机器学习和模型训练,制造了一台智能桃子分拣机,从形状、大小、色泽、光洁度等多维度,对桃子自动分级,从而实现自动分拣。该团队将 6400 张大桃照片按照红、大、中、小等元素按照分档建立图片数据集合,将图片数据集放入卷积神经网络(CNN)中进行训练,自动提取用于分级的影响要素并形成分类逻辑。实现对大桃的自动分列、判断、分装,准确率达到 90% 以上。
2、第二产业
无人自主挖掘机
百度与铁甲合作推出的无人自主挖掘机,是世界上首台基于视觉技术构成的低成本、可以量产的解决方案工程装备。采用百度的无人自主挖掘机,能够将施工效率提升 15%,人力成本降低 40%,实现收入提升 50%以上。制造业的 AI 化不仅可以解放人力,还可以激活产业,推动智能制造的发展。
智能零件分拣机
质检是绝大多数制造企业的必备部门。但现在,大多数零件制造企业的质检,还只能靠高密度的人工检测。PaddlePaddle 与领邦智能深度合作打造了领邦智能零件分拣机,实现零件的自动分拣,基于官方支持的 ICNET 模型,分拣精度可达到 99%以上,预测速度较同类产品快 20%。此外,分拣机还在通用性上有很好的表现,机器可支持几十种形状的高精密小零件的分拣。
3、第三产业
AI眼底筛查一体机
基于百度大脑的 AI 眼底筛查一体机在 2018 百度世界大会上正式亮相。AI 眼底筛查一体机已在广东肇庆等多个地区落地,可以帮助患者快速的筛查包括糖网、青光眼、老黄等多种眼底疾病,提早预防致盲风险,该系统经过权威测试,筛查准确率已经相当于 10 年以上的眼科医生。大会现场,李彦宏宣布百度将与卫计委合作,在 834 个国家级贫困县中的 500 个贫困县的医院,部署搭载 AI 眼底筛查系统的一体机,帮助基层的眼病患者尽早的发现致盲的风险,及时就医。
援藏医生利用深度学习进行显微镜下寄生虫虫卵识别
陈静飞,援藏医生(4 年,西藏农牧学院),去西藏前是临床方面的医生(主要集中在微生物感染疾病上)。援藏医生陈静飞在西藏地区 9 地调研后发现,藏区牧民、牲畜寄生虫感染率比内地明显严重。原因不仅在于西藏人少地广、牧区面积大,人畜接触多,同时也因为西藏地区基层医疗单位缺乏技术过硬的检验人员,感染率居高不下,且医生不知道病人感染的是什么寄生虫,也不知道该用什么药。
零 AI 基础的援藏医生陈静飞借助百度 EasyDL 进行显微镜下寄生虫虫卵识别,辅助检验人员进行寄生虫虫卵的相关诊断,有效改善人工识别的诸多不足。现在这套系统已经可以识别 10 多种寄生虫虫卵,在小范围的临床检验试点里,识别测试准确率稳定在 97%以上,未来几个月,可以实现识别常见的 40 多种寄生虫虫卵,并不断提高识别准确率和识别速度。换句话讲,这个系统只用了几个月时间,识别能力可以相当于一位有 20 多年临床经验的检验专家,比一般检验医师识别寄生虫的种类要多很多,同时准确率和识别速度更好。
陈静飞表示,希望借助 EasyDL 辅助西藏基层医生诊断寄生虫,解决基层一线医疗单位寄生虫虫卵识别能力不足的问题,改善西藏地区寄生虫危害。
美国零售商 Checkpoint 超市购物车监控
美国零售安防提供商 Checkpoint 基于百度 AI 技术能力,通过与普通摄像头结合,打造智能抓拍机,用于监视超市购物车下层是否有未付款商品,并精准排除残疾人购物车及儿童购物车。这种方案成本低、效率高,已在美国纽约州、新泽西州、宾夕法尼亚州等七个州的 160 个超市中,总计约 1600 台摄像头设备上落地。该模型的准确率达到 95%以上,远超此前靠传感器判断的准确率。