Android Studio集成Gemini新增多模态功能,开发者可上传图像获取UI代码

站长之家 2025-03-14 15:09:58新闻资讯
444

谷歌最新宣布,Android Studio中的Gemini助手已升级支持多模态输入功能,开发者现在可以直接将图像附加到提示中,以获取应用程序开发过程中的视觉辅助。

Gemini.png

这项多模态功能最初在I/O2024大会上亮相,升级后的Gemini现能够"理解简单的线框,并将其转换为可用的Jetpack Compose代码"。在Android Studio Narwal的Canary版本中,Ask Gemini字段新增了"附加图像文件"(支持JPEG或PNG格式)选项。谷歌建议用户使用具有"强烈色彩对比"的图像并提供"清晰的提示"以获得最佳效果。

开发者可以上传从简单线框到高保真模型的各类屏幕截图和用户界面,并能指定预期功能。例如,在计算器设计示例中,可以要求"使交互和计算按预期工作"。

Android Studio.png

将视觉设计转化为功能性UI代码的典型提示包括:1."针对所提供的此图像,编写Android Jetpack Compose代码以制作尽可能接近此图像的屏幕。确保包含导入、使用Material3并记录代码。"2."对于提供的这张图片,编写Android Jetpack Compose代码以制作尽可能接近此图片的屏幕,在颜色上发挥创意。使交互和计算按预期进行。确保包含导入、使用Material3并记录代码。"

Android Studio2.png

谷歌将Gemini定位为提供"初始设计框架"的工具,生成的代码通常需要进一步编辑和调整。常见的改进包括确保正确导入可绘制对象和图标。谷歌建议将生成的代码视为高效起点,从而加速UI开发工作流程。

此外,Gemini的视觉分析功能还可用于识别和解决错误,开发者可以"上传有问题的UI的屏幕截图,Gemini将分析该图像并提出潜在的解决方案"。开发者还可以附加相关代码片段以获得更精确的帮助。

Android Studio中的Gemini还支持上传架构图并获取解释或文档,类似于此前在I/O大会上展示的Gemini Astra眼镜功能。

Android Studio Gemini
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Gen-CLI:基于DeepSeek的AI命令行编程工具,谷歌Gemini-CLI平替方案
Gen-CLI是一个开源的命令行编程工具,旨在为国内开发者提供类似于谷歌Gemini-CLI的AI辅助编程体验。该项目基于开源的Gemini-CLI进行改造,通过调用硅基流动(SiliconCloud)平台...
2025-07-09 新闻资讯
838

Gemini CLI:谷歌开源的命令行界面AI编程工具
Gemini CLI是谷歌开源的一款命令行界面AI编程工具,它将Google Gemini系列大模型的强大能力直接集成到开发者终端环境中。作为基于Gemini 2.5 Pro多模态模型的AI代理框架,Gem...
2025-06-27 新闻资讯
573

Android Studio 中使用 SQLite 数据库开发完整指南(Kotlin版本)
对于Kotlin开发者来说,掌握在Android Studio中使用SQLite数据库进行数据存储和管理的方法是必不可少的技能。本文将提供一份完整的指南,帮助Kotlin开发者快速上手并在Androi...
2025-04-30 编程技术
553

Android Studio下载及安装图文教程(详细版)
随着移动应用的快速发展,Android Studio作为官方推荐的集成开发环境(IDE),已经成为Android开发者不可或缺的工具。为了帮助新手快速上手并高效地进行Android开发,本文将提供...
2025-04-28 编程技术
1206

谷歌发布全新AI模型Gemini 2.5 Pro 免费开放使用
谷歌宣布其最新的人工智能旗舰模型 ——Gemini2.5Pro将免费向所有 Gemini 应用用户开放。这一消息意味着,早前仅限于付费.99美元每月的 Gemini Advanced 用户才能体验的高端功...
2025-03-31 新闻资讯
419

Cursor 免费平替:Roo Cline+DeepSeek-v3/Gemini-2.0+RepoPrompt,打造极致AI辅助编程体验!
今天,我们将为您介绍一种免费的Cursor替代方案——Roo Cline结合DeepSeek-v3/Gemini-2.0以及RepoPrompt,让您在熟悉的VS Code环境中,也能享受到媲美Cursor的AI辅助编程体验...
2025-03-21 编程技术
573