新闻动态

您当前的位置: 首页 > 新闻动态 > 行业新闻

科技巨头们要用无障碍科技改变世界,腾讯和Facebook已经用上了AI技术【开云(中国)Kaiyun】

作者:开云(中国)Kaiyun 发布时间:2024-09-30 14:10:04 浏览:

本文摘要:,为用户自定义(如文字、图形设置、颜色和高对比度)获取反对,为UI某些部分获取更换选项或候补选项。

,为用户自定义(如文字、图形设置、颜色和高对比度)获取反对,为UI某些部分获取更换选项或候补选项。近期的操作系统Windows10中,微软公司针对视觉障碍人群有屏幕阅读器、高对比度主题、放大器等功能;听力障碍的人群可以利用字幕理解试唱媒体内容;行动障碍人群可以通过语音辨识技术来解决问题用于问题。体验方面,从微软公司展出的视频看,语音对屏幕内容的叙述速度对视觉障碍的用户有可能有些慢,对没视觉障碍的人来说叙述有变得有些非常简单。

移动互联网时代,Android和iOS统治者着市场,因此谷歌和苹果也都在自家的系统中重新加入了辅助功能。Android的无障碍功能有屏幕阅读器,通过触目和语音对系统构建与设备的对话;还有表明的变更设置,还包括字体大小、缩放功能以及表明的对比度和颜色;对话控件则是利用语音关上应用于和展开导航系统及改动文字;还可以通过蓝牙将可创下的盲文显示屏相连到Android设备;也能为Android设备打开字幕表明功能及登录的字幕。当然,基于原生Android系统的无障碍功能,手机厂商和OEM也能再行做到无障碍功能的改良和创意。

有意思的是,iPhone上的无障碍功能曾被普遍用于。由于早期iPhone Home键更容易再次发生失灵的情况,不少iPhone用户都打开了辅助功能中的AssistiveTouch,这只不过是苹果为有肢体障碍的人群设计的功能,也是苹果多个的无障碍功能之一。

据理解,苹果在iOS系统中重新加入针对残疾人群的功能可以追溯到2009年iPhone 3GS中的颜色翻转,后来系统中又减少了专门为视障人士研发的屏幕读者技术VoiceOver、放大镜等功能。如今的iOS系统针对视力、听力、肢体与活动能力、自学与读写能力有障碍的人群都重新加入了辅助功能。我们告诉,苹果在PC、移动领域都获得了不俗的成绩,所以除了iOS系统,苹果PC用于的macOS系统中也包括屏幕和光标缩放、全功能屏幕阅读器、可用闪光警告、隐藏式字幕反对等辅助功能。

还有值得一提的是,除了软件方面的设计,苹果在iPhone7和Apple Watch中内置了Taptic引擎,通过振动向用户获取触觉对系统,这一设计融合Watch OS 3.0能为视觉障碍用户报时。社交巨头融合AI的无障碍技术可以看见,微软公司、谷歌、苹果都在自家系统中减少了辅助功能,为的是人数占到比并不大的残疾人士也能享用到科技带给的便捷,这些系统中的无障碍技术有诸多相似之处也各有一些差异,体验也不存在差异。

当然,仅有系统层面的无障碍技术还远远不够,有所不同的应用于想构建更佳的体验必须更加有针对性的无障碍技术。值得注意的是,找到美国科技巨头Facebook和中国社交巨头腾讯都是首度将AI技术带入到无障碍科技的公司。Facebook在打造出的是无障碍环境的过程中,除了在应用于上相容有所不同系统的无障碍功能,Facebook还将对系统带入AI系统,让视觉障碍的人群也能“背诵”照片内容。

Facebook期望利用自家的Automatic Alt-Text (AAT)技术,让屏幕阅读器用户也需要解读新闻启动时中大部分甚至全部的图像内容。国内的社交巨头腾讯某种程度也在相容PC和手机设备系统的基础上,用AI技术协助视障用户“看见”图片,扫除他们的社交障碍。

据报,在QQ空间独立国家版7.7安卓版的新功能中,有一个是用AI技术对图片展开叙述并自动朗诵。具体来说,用于安卓系统的视障用户可以在QQ空间APP页面图片,读屏软件不会朗诵出有AI分解的一句图片叙述,利用科技可以“看见”网友共享的图片,更加深层参予到社交场景中。QQ空间无障碍版本“图片语音即时叙述功能”了解到,不具备上述功能的QQ空间APP带入了来自腾讯AI Lab的图像叙述分解技术,这项技术是腾讯AI Lab自律研发的增强自学算法,在国际顶级大赛MS COCO的该类别挑战赛上名列第一,打破微软公司和谷歌等公司。

也许在没视觉障碍的人群显然这个技术过于“白科技”,但从学术研究的角度来看,图像叙述分解的研究某种程度必须解读图像,更加必须解读自然语言,这是一个跨学科横跨模态的交叉研究课题,也是对深度神经网络的自学能力向多个数据域拓展的一步最重要的探寻。腾讯 AI Lab 研发了新的增强自学算法(Reinforcement Learning)以进一步提高图像叙述分解的模型能力(原理如图),适当的图像叙述分解模型,使用了编码器-解码器(encoder-decoder)的框架,同时引进了注意力(attention)的机制。在解码的过程中,AI Lab 创新性地用于了多阶段的注意力机制,除了引进多阶段的注意力机制,AI Lab 所研发的增强自学算法能更进一步提高建构的网络模型的训练效果,另外,针对此不能扰的问题,AI Lab 用于增强自学算法训练网络模型以优化这些取决于指标。图像叙述分解(image captioning)除了图片叙述,QQ还和优图团队合作发售了OCR图片文字萃取功能。

具体来说,只要关上手机QQ,宽按对话框中的图片自由选择“萃取图中文字”,或是页面“洗一洗”中的“文字萃取”,就可以将图片上的文字内容智能识别沦为可编辑的文本,让视障用户可以很便利地萃取好友放的图片上的文字。同时,OCR图片文字萃取功能可以构建多场景应用于落地,协助视觉障碍用户读者书籍、食品、药品说明书等。

OCR图片文字萃取功能的背后是优图实验室世界领先的深度自学技术,它可以在给定版面下辨识出整图的文字,还包括中英文、字母、数字、标点等共计1000种标签,并覆盖面积到数十种字体,符合生活中大部分场景的读图识字市场需求。手机QQ OCR辨识功能在AI技术的护持下,视障用户的社交痛点正在被解决问题。一位体验了QQ空间自动识别图片后“讲出”文字描述的视障用户说道:“医学无法让我们陈德,但也许科技可以。

”另外,一位湖南视障用户因为读屏软件加载QQ表情为空信息而后遗症,为此手机QQ研发出有表情加载功能让他不仅能与外界流畅交流也能用表情传达内心的点子。(公众号:)指出,随着AI技术的护持,未来QQ将需要更加生动地加载更好的表情包在,让视障人群需要更佳地用于表情包在。QQ表情加载用无障碍技术转变世界腾讯用AI技术让更加多的视障用户需要更容易地展开社交,只不过早在2009年腾讯就开始注目视障用户用于情况,在PC中推展无障碍技术的改建,使QQ沦为国内盲人群体最主要的网络社交平台。2013年,手机QQ作为国内首批反对无障碍特性的APP。

2014年1月,腾讯公益慈善基金与致力推展信息无障碍的NGO一起重新组建了“视障信息无障碍工程师”团队。2017年,手机QQ共兼容1934个无障碍特性,技术上发售OCR图片文字萃取功能、QQ表情加载、安卓平台安全性缴纳、声纹特好友、有效地辨识多条链接等无障碍功能。

2018年3月,在中国残疾人联合会、中国盲人协会、中国互联网协会信息无障碍工作委员会的反对下,QQ空间启动“无障碍AI技术”对外开放项目,通过“多媒体AI平台”小程序上的“无障碍AI”入口,首批对外开放还包括OCR文字辨识、语音合成、图片并转语音三大无障碍AI 技术。目前,腾讯旗下的QQ、QQ空间、微信、腾讯网、腾讯新闻、应用于宝、企鹅FM等大部分产品已针对残疾用户构建专门优化。

值得一提的是,QQ和QQ空间涉及功能在2018年使用量多达1.6亿次,早已沦为国内视障群体最主要的网络社交平台。腾讯在这一领域的持续代价也获得了接纳,法国当地时间2018年12月3日,联合国教科文组织(UNESCO)在巴黎授予“数字技术强化残疾人权能奖”,该奖项表扬“增进残疾人多元文化发展,通过数字技术为残疾人生活建构合理便捷条件作出杰出贡献”的个人和的组织。必须认为的是,腾讯是亚洲首个得奖的的组织,也是全球范围内首家得奖的企业。小结残疾人群数量只占到全球人口总数的较小比例,但是我们难过的看见无论是支配PC时代的Windows系统还是统治者手机时代的Android和iOS都为残疾人群减少了辅助功能,社交巨头腾讯和Facebook堪称首度将AI技术应用于到自家的产品中,提高残疾人士的用于体验,扫除他们的社交障碍,让所有人都能感受到科技转变生活,堪称科技巨头们用技术转变世界的一个行径。

现在,我们不仅看见有更加多公司的产品开始重新加入针对残疾人群的设计,也看见了腾讯早在2009年就开始注目视障用户,期望用淋漓尽致的产品体验符合所有人的社交市场需求,并且这个希望也获得了联合国教科文组织的接纳。原创文章,予以许可禁令刊登。下文闻刊登须知。


本文关键词:开云(中国)Kaiyun,开云(中国)Kaiyun·官方网站-登录入口

本文来源:开云(中国)Kaiyun-www.xian6.cn


 

Copyright © 2000-2024 www.xian6.cn. 开云(中国)Kaiyun科技 版权所有  备案号:ICP备61984311号-5

搜索