盲人辅助神器!微软Seeing AI正式登陆安卓平台 支持18种语言

站长之家 2023-12-06 11:21:32新闻资讯
548

微软的Seeing AI应用如今已经登陆安卓平台,为盲人和视障用户提供更多便利。这款应用最初仅支持iOS平台,但如今在一篇博客文章中,Seeing AI的创始人兼领导者Saqib Shaikh宣布了对安卓平台的扩展,并强调了一些新功能。

该应用现在在App Store和Google Play上均可下载,通过识别和描述用户周围的人物、物体、文本等元素,旨在帮助用户更好地导航周围环境,并通过朗读文本来理解文件和其他实体物品。

Seeing AI.png

首先是文本识别功能。启动应用并将手机对准印刷或手写文本,Seeing AI将开始朗读文本,直到朗读完毕。其次是文档识别,将手机对准整个文件,应用将扫描并显示其中的文字,用户可以通过播放、暂停、快进或倒退来听取文档的朗读。

此外,应用还提供了条形码阅读器,可通过扫描商品上的条形码识别并朗读相关信息。用户还可以拍摄周围环境的照片,应用将描述整体场景以及照片中的个别物品。

人物识别功能将扫描被摄像头捕捉到的人物,并突出显示其视觉特征,同时显示其与用户的距离。最后,货币扫描器将分析纸币或硬币,告诉用户其价值。

作为进入安卓平台的一部分,该应用还进行了一些近期的增强。现在,扫描照片将提供对图像中捕获的细节更丰富的描述。此外,用户现在可以向Seeing AI提出有关扫描文档的更多问题,例如了解菜单上的菜肴、获取目录页上物品的价格,或听取文章摘要。

Shaikh表示:“全球有超过30亿的活跃安卓用户,将Seeing AI引入这一平台将使更多盲人和低视力社群的人们能够在日常生活中利用这项技术。”他还表示,安卓版本和新功能是为庆祝国际残疾人日而推出的。

Seeing AI现在支持包括捷克语、丹麦语、英语、法语、德语、希腊语、意大利语、日语、韩语、波兰语、葡萄牙语、俄语、西班牙语和瑞典语在内的18种语言。微软计划在2024年扩展到支持36种语言。

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

国内中文字体商用授权情况一览(微软雅黑、思源黑体等)
在数字化内容创作与商业传播中,中文字体的选择已从单纯的美学需求演变为法律合规与商业安全的双重考量。本文站长工具网聚焦微软雅黑、思源黑体等主流中文字体,结合方正字库...
2025-09-12 站长之家
546

AiPy:让您用自然语言指挥AI自动写Python代码的开源工具
AiPyApp(简称AiPy)是一款将大型语言模型(LLM)与Python生态深度融合的开源工具,旨在通过自然语言交互实现任务的自动化执行。其核心理念是“需求解析→代码生成→自动执行...
2025-09-02 新闻资讯
685

VibeVoice:微软开源的一款文本到语音(TTS)生成模型
VibeVoice 是微软研究院开源的一款革命性音频生成模型,其1.5B版本在语音合成领域实现了多项重大技术突破,被业界誉为"语音界的Sora"。作为基于人工智能的文本转语音(TTS)系统...
2025-08-26 新闻资讯
923

AI Sheets:Hugging Face开源的一款创新型零代码数据处理工具
一、AI Sheets是什么AI Sheets 是Hugging Face团队开源的一款创新型零代码数据处理工具,它将大型语言模型(LLM)的强大功能直接引入用户熟悉的电子表格界面,彻底改变了开发者...
2025-08-13 新闻资讯
514

Wassette:微软开源的一款专为AI Agent设计的安全工具
Wassette 是微软开源的一款专为AI Agent设计的安全工具扩展运行时,基于Rust语言和WebAssembly(Wasm)技术构建。其核心目标是解决AI Agent在动态加载外部工具时的安全性问题...
2025-08-08 新闻资讯
515

Next-Frame Diffusion:微软与北大联合开发的开源自回归视频生成框架
Next-Frame Diffusion(NFD)是由微软研究院与北京大学联合开发的开源自回归视频生成框架,作为当前最具突破性的实时交互式视频生成技术之一,其核心创新在于通过块状因果注意...
2025-06-14 新闻资讯
548