2007年1月9日,当初代iPhone横空出世的时候,踌躇满志的乔布斯在演讲台上非常明确地指出:无论是Mac、iPod还是iPhone,它们的革命性创新都体现在人机交互方式的进化。
比如说,在移动互联网和人工智能的融合发展浪潮中,以苹果Siri、Google Assistant为代表的智能语音助手成为一时之风尚,它们在触控之外,开启了一种新的交互方式——也就是更加符合人类交流方式的语音对话。这种交互方式在诞生后数年,就快速覆盖了整个行业。
然而,语音助手并不是终点,人们依旧在人机交互层面寻求面向未来的进一步突破。尤其是当下,iPhone已诞生将近 15年,AI/AR/VR/数字媒体等技术得到飞速发展,元宇宙概念也勃然兴起。值此技术飞速变革之际,一个值得深思的问题已经摆在整个行业面前:
当然,这是一个需要整个行业通过实践来给出答案的问题——而在诸多答题者中,让雷锋网眼前一亮的,是凭借自身AI实力来践行自身对未来人机交互大方向思考的OPPO。
截至今年8月,ColorOS全球月活跃用户达到了4.6亿,庞大的用户服务需要强大的技术能力,尤其是AI能力的支持。那么,OPPO支撑全球超过4.6亿用户的AI服务是如何构建的呢?
对于人机交互的未来,真正能够代表OPPO自身思考和选择的,是它旗下小布助手在近日 OPPO 开发者大会上的一次重要进化。
简单来说,就是将OPPO小布助手从以往基于语音交互的智能辅助工具形态,进化为基于虚拟人多模态交互的智能助手形态,从而将人与智能助手之间的交互演化为人与虚拟人之间的交互。
这不难让人理解——毕竟,基于多模态交互的“虚拟人”,已经成为当前人机交互探索发展的新方向,也成为整个行业参与者的共同选择。
比如说,在今年6月,中国首个原创虚拟学生“华智冰”的身份以本科生的身份进入到清华大学;而设计虚拟学生“华智冰”的初衷,是希望她最终能像人一样思考,像人一样不断学习,理解人的想法,主动产生符合用户需求的互动,直观、全面地捕捉人类的需求——当然,“华智冰”诞生的背后,体现的正是多模态交互的成果。
比如说在9月份,小红书同时入驻了20+虚拟偶像,她们化身潮流情报官,首发试穿诸多潮流品牌的新品,演绎不一样的潮流魅力……前不久,虚拟人AYAYI也成为了天猫超级品牌数字主理人,并且开了个天猫双11元宇宙艺术展,有趣的是,华为在今年 HDC开发者大会上首次采用数字人全程实时手语直播。
比如说,新华社和腾讯联合打造了专门面向航天主题和场景研发的数字航天员、数字记者“小诤”;日本原宿风少女数字人imma,在9月初还登上了东京残奥会的闭幕式;浦发银行和百度共同发布了数字员工“小浦”;湖南卫视宣布推出了首个数字主持人小漾,而江苏卫视则直接开播了一档宣传虚拟偶像的节目《2060》……
可以看到,伴随着当前人工智能、虚拟现实等数字媒体技术的不断发展,基于多模态交互的虚拟人已经从互联网和数字世界走向人类的实际社会场景,并且这已经成为大趋势——甚至有观点认为,虚拟人将会成为未来人机交互的基础模态。
正是在这样一个大背景下,OPPO也在洞察到人机交互发展大势的基础上,不失时机地实现了小布助手从语音助手到“虚拟人”的新一轮进化。
小布助手是国内首个月活用户数破亿的手机语音助手,当前月活已经达到1.3亿,是 OPPO AI应用的集中体现。作为最早以智能手机为载体的人工智能助手,小布以语音交互为主体,覆盖了OPPO系多个手机品牌,在后来发展过程中,它又被逐渐应用于智能手机、电视等多个品类智能终端设备。
自2018年诞生以来,小布助手经历了多次升级,不断在功能和体验上推陈出新。 本次 OPPO 开发者大会上,OPPO方面宣布,小布助手已经正式从纯粹的语音助手升级为多模态的智能助手,包含语音、建议、指令、识屏和扫一扫五大能力模块。
多模态的需求,是智能时代智能助手的关键特征,智能助手需要兼容不同的软硬件智能场景,引入更多的AI能力,并且将它们紧密地与原有的 AI 能力结合在一起,形成综合的AI能力。
作为业界首个基于虚拟人多模态交互的手机智能助手,小布虚拟人打破了交互次元方式,将人与智能助手之间的交互,演化为人与虚拟人之间的交互。
据悉,在破次元人机交互的探索中,“小布虚拟人”可以实现与用户在多个场景生态下的内容服务、实时交互以及情感化交互,其首期上线的拟人化播报新闻和天气等功能便是直接体现;目前这一功能已覆盖OPPO Reno5/6、Find X3系列机型。
同时,小布虚拟人融合了语音、语义和视觉多模态交互技术,能够提供自然流畅的虚拟数字技术交互体验。在多模态情感识别算法的加持下,小布虚拟人可以敏锐捕捉用户情绪特征,打造与用户之间的多维情感畅联。
每一位开发者都能够定制专属的小布虚拟人。它们可以拥有不同的声音、形象、性格、技能以及服务,化身为不同的角色,例如智能客服、虚拟助手、带货主播等,并搭载在多个智能终端设备上。
OPPO此番动作,不仅是赋能开发者在人机交互层面实现虚拟人的进化,从而进一步融入到整个行业的虚拟人发展大势中。究其本质,是为了面向用户提供更加智能化、个性化和自然真实的交互体验。
如果说小布的进化是一次变身,那么AI技术可以说是这一变身背后的核心魔法弹药。
实际上,“万丈高楼平地起”,无论是小布助手的蜕变升级,还是OPPO为开发者构建的开放平台生态,都是以OPPO全栈式AI技术生态能力为底座——毕竟,而唯有底座稳健,高楼才能拔地而起。
从OPPO在AI上的投注来看,其在AI上的布局是具备规划、结合点面的长线思维。其中,AI框架是OPPO整体AI能力的重点,也是其AI实力的一大体现。
为了构建这一AI框架,OPPO花了相当大的精力成本打造出OPPO全栈式AI技术生态,据了解,这一AI技术生态由6个部分组成,主要包括:
众所周知,机器学习需要大量的数据计算和验证。OPPO当前已经进入全球50多个国家,ColorOS月活跃用户达到了4.6亿,庞大的用户基数也为其全栈式AI技术生态累积了海量数据和计算资源。
以季度为单位,视频云调用超过4.2亿次,新增照片超过300亿;大数据每日新增超过10PB,合云基础设施覆盖全球八大区域。
从机器学习系统来看,OPPO全栈式AI技术生态提供了端侧和云侧两大部分——其中,位于端侧的端侧算法引擎、加速框架和模型雅座提供低延时的高效相应;云侧则是将上传到云端的端侧数据进行大规模训练和推理,从而反过来优化端侧算法。
在海量数据和出色的算法、算力加持下,OPPO AI不断在业内获得认可,其基于知识的大规模预训练,包括上下星空体育登录入口 星空体育在线官网文理解、短文本相似度等语音语义的多项指标多次登顶行业权威评测。
不仅如此,在世界顶级的计算机视觉会议CVPR上,OPPO在2020年和2021年分别取得了极端超分辨率感知第一、手持设备视觉定位第一和多目标行为分析少样本分类第一的成绩。
另外,从AI能力来看,OPPO AI具备了语音、NLP、知识图谱、CV、推荐搜索等基础能力,其端到端生成式对话模型的人工评测满意度已超过了85%,属于行业较高水平;而这一成果已应用在小布生成式闲聊的业务场景中。
在具备强大的AI能力之外,安全性也是不可忽视的重要一环。雷锋网了解到,OPPO AI安全技术从应用检测、恶意防护到攻击对抗等各个方面提供了全方位的安全保障。
官方数据显示,在应用检测上,累计检测APP超过53万,发现恶意APP超过1万款,浏览器每天拦截恶意下载逾300万条,并拥有超过15万条隐私政策;在恶意防护上,为用户过滤恶意行为超过1140亿次,封禁恶意账号280万个。
不难看出,OPPO全栈式AI技术生态是OPPO AI关键能力和技术优势的落地实践,为OPPO海量的AI服务提供了夯实的架构基础、更高的资源利用效率以及安全可信的隐私保障。
当然,仅仅有AI技术能力并不够。OPPO希望打造的AI生态在具备智慧之外,更重要的是有人性、有温度。
因此,针对都市人群心理问题,OPPO发布了“AI升温计划”,每天为超过200万人提供暖心陪伴;同时,针对手机适老化,OPPO 打造了小布助手关怀版,已经改善了 700 万老年用户的手机使用体验;针对传统文化传承,OPPO还联合音乐人阿朵共同推出了“我是民乐守艺人”活动,全网曝光量超过28亿,以科技创新的形式带动民乐的传承推广。
当然,在雷锋网看来,OPPO小布助手的进化,在根本层面反映的是OPPO对于AI等基础技术的大力投入和持续积累,对于行业新概念、新趋势的积极拥抱和不断探索——但更重要的是,基于对未来人机交互形态的不断探寻,反映了 OPPO对于每一个普通用户的实际产品体验的极端重视。
从某种程度上来看,无论是语音助手,还是“虚拟人”,真正优秀的设备使用体验,必然是建立在对用户本身的深入理解和感知之上,并且要同时用技术的力量和人文的视角将这种理解和感知体现在具体好用的软硬件产品之上,才能够直抵用户的真正需求。
这也是每一个真正面向消费者的科技公司,都应该如同乔布斯一样站在科技和人文的交叉口的原因。