向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
中国电影2022:现实主义、类型化与问题意识******
作者:张冲
2022年中国内地电影总票房约为286亿,电影票房排行榜前几位的有《长津湖之水门桥》《独行月球》《这个杀手不太冷静》《人生大事》与《万里归途》等。纵观2022年的院线电影,可以看到现实主义题材依旧是商业电影的主打招牌,从新主旋律大片《长津湖之水门桥》到喜剧电影《这个杀手不太冷静》,包括口碑不错的艺术电影如杨荔纳的《妈妈!》等,大都运用现实主义手法为观众提供不同时空方面的社会现实。考察这些电影会发现有以下几个方面的特征,即在不同的时空内对社会现实加以呈现,在此现实主义题材的创作中,类型化、民族化特征愈加明显,且对社会问题的深切关注愈加多元。
现实主义影片中的历史、现在与未来
2022年大年初一上映了徐克导演的抗美援朝故事片《长津湖之水门桥》。该片以抗美援朝第二次战役中的长津湖战役为背景,讲述中国人民志愿军第九兵团七连的战士们在连长伍千里的带领下,兵分四路进行突击、火力、爆破与掩护。电影在呈现连长伍千里的组织、作战能力的同时,也呈现了一位普通军人从青涩少年历练为成熟战士的过程。
饶晓志执导、根据真实事件改编的撤侨电影《万里归途》则较为鲜明地彰显了中国国力,呼唤“为人民”的公义精神。电影以温暖现实主义的风格,书写了海外撤侨过程中,外交部工作人员对海外侨民及打工者的爱护与自我牺牲。同样具有温暖现实主义特征的影片还有薛晓璐导演的《穿过寒冬拥抱你》。故事发生在新冠疫情刚刚开始的武汉,讲述人们如何面对封城和治疗,如何解除焦虑,面对生活。电影试图以温情来疗愈焦虑中的大众——快递员、外卖骑手、城市中产阶层、医生与教师等。疫情下,困难激发了他们爱的能动性,也给了周围人积极的力量和勇气。这些追光者、发光者以微笑、爱和奉献抵御困难。
在国际生态环境批评方兴未艾的大形势下,中国的现实主义题材电影也免不了对未来的现实加以讨论。吴炫辉导演的《明日战记》将时间定格在未来世界,一方面批评地球因人类的过度开发而导致严重的环境污染,一方面批评权力欲对人类社会的破坏。军人和总指挥在科学改善“潘多拉”与“天幕”计划之间展开博弈,此叙事线使得这部电影带有一定的寓言与评判功能。
“现实主义”是针对“浪漫主义”的不切实际而提出的,并试图抵制“浪漫主义”中的谎言、幻想与伪饰,对“既缺乏教育意义也没有娱乐作用”,又“暴露作者无知”或“蹩脚”的作品持审慎态度。文牧野导演的《奇迹·笨小孩》中年轻的哥哥景浩为了给妹妹治病,必须在一年半内凑齐35万元。他创办好景电子元件厂,拆解残次手机中的零件卖给手机公司,只要良品率达到85%以上,4个月就可以赚80万元。哥哥的公司在既没钱又没人的情况下,以直面抗击苦难的方式成功了。刘江江编剧并导演的《人生大事》通过殡葬师这一职业来讨论人的“生死”问题与当下的关系。殡葬师莫三妹在刑满释放后的一次出殡中,被孤儿武小文纠缠上。影片除了对“生死”的问题进行讨论,也对如何面对成功学、励志学提出了自己的看法。
现实主义题材电影难以避免的陷阱是煽情。关于这一点,捷克哲学家贝尔纳德·博尔扎诺指出:“在对仍具有争议性的话题进行讨论时,必须进行冷静清醒的省视,而非更多使用煽情式语调或非经过思虑的言辞。”韩寒编剧、导演的《四海》中的吴仁耀与“丧偶式”父亲、与暗恋女孩之间铺陈了太多泛滥乏味且缺少逻辑的情感;同样,杨荔纳的《妈妈!》亦是如此,银幕上满溢着父女间、母女间的煽情,与她之前富有独立思考的电影《春潮》截然不同。
类型化、民族化与现代性
电影的“类型化”与亚里士多德关于戏剧的“完整动作”摹仿说息息相关。电影《长津湖之水门桥》中的伍万里较好地完成了从“不懂事”到“懂事”的成长,净化了心灵、升华了认知;邢文雄编剧、导演的《这个杀手不太冷静》中,米兰完成了从“骗人”到“不骗”且舍命救人的突转,使得观众在此突转变化中,精神上得以“净化”与“升华”;《奇迹·笨小孩》使得“笨小孩”从不可能产生“奇迹”到“奇迹”发生。
喜剧电影是中国院线片的重要类型之一,2022年内地的大部分喜剧被东北地域文化所感染,如《独行月球》《东北虎》与《这个杀手不太冷静》等。这些影片呈现的东北现象凸显了游牧文化对中原文化的有益补充和丰富,在银幕上呈现了不同于儒家文化的酒神精神、自由、创造力与生命力。张吃鱼导演的《独行月球》更是如此。地球末日时分东北的独孤月、马蓝星为拯救全人类放弃了个体生命,此寻找希望与光明的主题,拓宽了以往内地喜剧电影的视野与格局。
2022年的很多电影具有杂糅类型的特征。如《独行月球》是喜剧与科幻的杂糅、《明日战记》是科幻与动作的杂糅、《熊出没·重返地球》是动画、科幻、喜剧与儿童电影的杂糅、《新神榜·杨戬》是科幻、儿童加传统文化类型的融合。林汇达导演的《熊出没·重返地球》杂糅了多种类型电影的风格,同时还对《功夫熊猫》(2008)、《超能陆战队》等动画电影进行戏仿与情节借用。虽然剧作上对熊二的塑造及线索的铺陈方面存在问题,但整体来说,还算是一部能让“合家欢”观众接受的影片。从此可以看出院线电影在商业化、类型化方面的新推进。
《新神榜·杨戬》
除了类型叙事上的推进,2022年的中国电影仍在以“民族化”方式“讲好中国故事”的道路上探索。如赵霁导演的《新神榜·杨戬》取自传统文化中封神的神话故事,但其在电影主题、空间创意与人物形象方面具有现代意识,从整个影片的基调上来看,可以看到传统文化中的潜力和可发挥的无限空间。
2022年的多部影片带有明显的现代性特征,讨论现代性就要讨论它与现实主义的关系。有一种观点认为:“现实主义发端于与浪漫主义的论争,最终在与现代主义的论战中逐渐丧失了主流话语的位置。”在未来,现代主义或者现代性能否作为补充中国现实主义电影可持续发展的主要元素?虽然卢卡奇批判现代主义“过分强调主观体验而割裂了人与存在的社会-历史环境”,并认为其“现实的稀薄导致人格的解体”,但是如果对“形式主义”“主观体验”及“去现实化的人格”进行充分反思的话,会不会对中国现实主义进行有益的补充?毕竟西方现代主义电影伴随着电影的诞生也前行了一百余年。从《独行月球》中的“全人类”意识、《这个杀手不太冷静》中对“人性”的反思、《明日战记》中的生态环境问题、《新神榜·杨戬》中女性和玄鸟守护世间“万物生生不息”和“安宁”等,可以看到,现代性既能生成中国传统文化的视觉奇观,又能与世界电影做跨文化对话。
艺术电影对社会问题的深切关注
2022年的一些艺术电影显示出对社会问题的深切关注。比如,《妈妈!》将阿尔茨海默症及中国老龄化问题呈现在银幕上。李玉的《断·桥》虽然在叙事方面存在一定的逻辑问题,但它以近似黑色电影的方式呈现了“利益”与“正直”选择的问题。
2022年初耿军导演的《东北虎》是艺术电影的一个亮点。影片以东北式的狂欢呈现了世俗生活中“俗”生活、“雅”文化与人的高贵之处。影片以静物特写镜头开始,在搪瓷盆里化着的冻柿子、冻秋梨犹如一幅静物油画,它和影片缓慢的鹤岗前工业节奏及东北人的游牧特征结合在一起,形成了影片独特的风景。收入不高的教师徐东为了贴补家用要去开挖掘机赚外快,和护士的暧昧关系被妻子美玲发现。美玲以她“坚强约等于狠”的方式处理此事——她理性地将生活的苟且和一地鸡毛清扫出家庭空间,使得女性人生充满了能动性和自足性。除了美玲,电影中的诗人罗尔科、建筑商马千里以及给马千里送风筝、带鱼和钱的市郊小二也独具特色,带有世俗的狂欢特征。但《东北虎》却不是闹剧、趣剧,而是充满了现代幽默、生活智慧与人情厚度的影片。
2022年的中国电影,整体创作有一定的进步,出现了新的科幻喜剧类型,主旋律大片在类型化创作上也渐趋成熟。2023年若在思想性、历史问题深刻性与经典叙事性方面有所超越,则中国电影纵身一跃而跻于世界一流电影之列,或许可期。
作者系北京电影学院副教授