华为今天发布了一款名为口袋视觉的新人工智能应用程序,旨在帮助视力受损的人用智能手机摄像头阅读文件、菜单和文本。在柏林举行的展会上,华为与中国一家专门研究视力障碍的社交科技公司小艾帮帮合作开发了这款应用。
口袋视觉在三个核心场景中使用了四轴摄像头技术和人工智能智能。首先它提供了一种文本到语音的模式,使用光学字符识别快速将图片转换为文本,然后大声读出文本。这可以用于描述餐馆菜单、书籍片段、时间表,或者任何东西。
此外,口袋视觉还采用了负像模式,用户可以通过相机镜头改变文本和背景之间的对比度。这将使阅读现实物体上的文字变得更加容易,比如麦片盒或医疗处方。最后,在放大模式下,用户可以使用设备上的音量按钮放大和增强小文本,使其不那么模糊,更清晰。
官方称,口袋视觉应用程序独家定位于荣耀20 Pro智能手机。然而考虑到它可以通过华为应用程序库下载,它实际上将适用于所有华为和搭载了所需镜头和人工智能的荣耀手机。它将有英语、西班牙语、葡萄牙语、德语、意大利语和汉语版本。
虽然华为对荣耀设备的关注确实限制了这款应用的应用范围,但值得记住的是,就发货量而言,华为仍然是全球最大的智能手机公司之一。
口袋视觉并不是华为推出的第一款以可访问性为重点的应用。早在去年12月,这家中国科技公司就推出了利用图像识别和OCR将儿童读物翻译成手语的应用。在其他地方,人工智能正越来越多地被用于改善从智能扬声器到自动驾驶汽车等一系列项目的可访问性。
利用荣耀手机的下一代人工智能能力和专业级相机技术,口袋视觉的目标是为视障人士提供一个公平的竞争环境,为这个社区提供一个便携式的、负担得起的解决方案,以满足市场上其他阅读辅助工具的需求,通过推出这款应用,我们希望为世界各地的人们创造一个更好的阅读体验,让他们有更大的独立感,让低视力的人有信心释放自己的潜力,追求自己的激情。
残疾问题研究所在2011年发表的一份报告中指出,虽然企业在改善数字产品获取方面可能存在一定程度的利他主义,但值得注意的是,残疾代表着一个有利可图的市场。如果残疾人是一个正式承认的少数群体,占美国人口的19%,他们将是美国最大的少数群体。
因此,口袋视觉的核心是展示技术和商业决策。据世界卫生组织的数据显示,全球约有13亿人患有某种形式的视力障碍,这意味着这类技术将永远供不应求。
领取专属 10元无门槛券
私享最新 技术干货