百度大脑“解锁”24种人工智能新能力
【中美创新时报据新华社北京3月22日电】(记者高杉、李宓)百度公司旗下“百度大脑”近日在北京举办了首期开放日,发布了24种全新的AI(人工智能)能力,包含在深度学习基础上的语音处理、视觉识别、知识图谱等新技术。
百度AI技术生态部总经理喻友平说:“AI已渗透至我们生活的各个角落。而今天,AI技术正在变得更广、更快、更精。”
百度大脑新推出语音识别极速版,首次开放搭载国际领先的注意力(attention)模型的语音能力,拥有更快的响应速度,时长5秒的音频不到500毫秒即可完成识别过程。此外,语音识别的预置场景由35个升级为51个。这意味着无论是询问天气、点播电视剧还是叫外卖,使用者都能够更加顺畅地与手机、智能家电或车载系统进行“对话”。
视觉方面,OCR(光学字符识别)、车辆分析、人脸人体、图像识别等技术都得到升级。应用广泛的人脸识别技术,检测关键点由72个增至150个。同时,新技术“人脸情绪识别”上线,可识别人物高兴、害怕、厌恶、悲伤等7种情绪,这项技术可在学校、幼儿园安全监控等场景得到应用,不仅能通过智能设备快速、精确找人,还能判断人物的情绪状态,从而及时进行预警及辅导等。
卡证OCR则新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证类别达到9种。只需对着户口本拍一张照片,系统就能将字段进行结构化识别,反馈出信息页内容,大大降低政务工作的人力及时间成本。
此次百度还上线了红酒和地标识别等有趣的新能力。喻友平透露,不久后,还会陆续发布车辆属性识别、手部关键点识别、更高精度的人像分割以及钱币识别等新技术。
在语言处理应用技术方面,百度大脑新增文本纠错、新闻摘要、智能写诗、智能春联和对话情绪识别等能力。一篇数千字的新闻报道,AI可在数秒内完成摘要的提取写作,并可对文本中错别字、音近字等进行自动纠错,降低了AI对人工的依赖。
百度还计划在4月上线智能写作平台,具备自动写作能力和热点发现、自动摘要、自动纠错等辅助写作能力。能够帮助写作者提供素材或帮助其找到灵感,提升写作效率和质量。
截至目前,百度大脑共开放了158项AI能力,平台上开发者数量超过100万,自2016年创建以来,已成为中国最大的AI开放平台。
喻友平认为,2019年会是AI产业全面加速落地的一年。
去年11月,北京海淀公园作为中国第一个AI主题公园正式向公众开放,这座公园的转型正是基于海淀区政府与百度签订的《建设海淀区“城市大脑”合作备忘录》。公园中安装的由百度EasyDL平台与北京分形科技合作打造的智能垃圾桶,可对7种常见垃圾自动分类,后期还将通过增加训练数据实现更多种类垃圾的识别。园内无人驾驶的巴士“阿波龙”、可语音对话的智能亭、刷脸的智能步道等装置也令体验者惊呼“未来已来”。
AI技术正在各个角落改变人们的生活,正有更多行业借助AI技术完成“智能”升级转型。喻友平说,AI的领域可以说无处不在,希望技术可以让复杂的生活日趋简单。(完)
题图:百度AI技术生态部总经理喻友平在开放日现场讲解百度大脑产品。(采访对象供图)