ShiftHackZ/Stable-Diffusion-Android: Android 平台的 Stable Diffusion AI 客户端应用

内容

Header

Google Play F-Droid

Google Play F-Droid 4pda

Stable Diffusion AI 是一个易于使用的应用程序,让您只需点击几下就能快速从文本或其他图像生成图像。通过这个应用程序,您可以与自己的服务器通信,并在几秒钟内生成高质量的图像。

  • 可使用由AI Horde(一个众包分布式集群的 Stable Diffusion 工作者)提供支持的服务器环境
  • 可使用由Stable-Diffusion-WebUI(AUTOMATIC1111)提供支持的服务器环境
  • 可使用由SwarmUI提供支持的服务器环境
  • 可使用由Hugging Face Inference API提供支持的服务器环境
  • 可使用由OpenAI(DALL-E-2, DALL-E-3)提供支持的服务器环境
  • 可使用由Stability AI提供支持的服务器环境
  • 可使用由 LocalDiffusion(Beta)提供支持的本地环境
  • 支持原始 Txt2Img、Img2Img 模式
    • 正面负面 提示支持
    • 支持动态 尺寸,范围从 64 到 2048 像素(宽度和高度)
    • 选择不同的 采样方法(可从服务器加载可用采样器)
    • 独特的 种子 输入
    • 动态的 采样步骤,范围从 1 到 150
    • 动态的 CFG 比例,范围从 1.0 到 30.0
    • 恢复面孔 选项
    • (仅限 Img2Img):从设备图库中选择图像(需要用户权限
    • (仅限 Img2Img):从相机捕获输入图像(需要用户权限
    • (仅限 Img2Img):为输入获取随机图像
    • (仅限 Img2Img):修复(适用于 A1111)
      • 掩模模糊(1 到 64)
      • 掩模模式(掩蔽,未掩蔽)
      • 掩蔽内容(填充,原始,潜在噪音,潜在空白)
      • 修复区域(整个图片,仅掩蔽)
      • 仅掩蔽填充(0 到 256 像素)
    • 批量生成,最多 20 张图像(适用于 A1111 和 Horde)
    • Lora 选择器(适用于 A1111)
    • 文本反转选择器(适用于 A1111)
    • 超网络选择器(适用于 A1111)
    • SD 模型选择器(适用于 A1111)
  • 应用内画廊,本地存储,包含所有 AI 生成的图像
    • 显示生成的图像网格
    • 图像详细视图:缩放,捏合,生成信息
    • 将所有画廊导出为 .zip 文件
    • 将单张照片导出为 .zip 文件
  • 设置
    • WebUI 服务器 URL
    • 活动 SD 模型选择
    • 服务器可用性监控(http-ping 方法)
    • 启用/禁用自动保存生成的图像
    • 启用/禁用将生成的图像保存到 Download/SDAI 安卓 MediaStore 文件夹
    • 清除画廊/应用缓存

这需要您拥有运行在服务器模式下的 AUTOMATIC1111 WebUI。

你可以选择在自己的硬件上使用来自Nvidia或AMD的现代GPU运行,也可以选择在Google Colab上运行。

  1. 请按照 Stable-Diffusion-WebUI 存储库中的设置说明进行设置。 2. 在 WebUI 启动脚本的命令行参数中添加 --api --listen 参数。 3. 运行服务器后,获取 WebUI 服务器的 IP 地址或 URL。 4. 在首次启动时,应用程序将要求您输入服务器 URL,输入后按下“连接”按钮。如果要更改服务器 URL,请转到“设置”选项卡,选择“配置”选项并重复设置流程。

如果由于某种原因您无法运行服务器实例,您可以在服务器设置页面上切换演示模式开关:这将允许您测试该应用并熟悉它,但会返回一些模拟图像而不是AI生成的图像。

这需要您拥有运行在服务器模式下的SwarmUI。

你可以选择在自己的硬件上使用来自Nvidia或AMD的现代GPU运行,也可以选择在Google Colab上运行。

请参考SwarmUI文档获取安装说明。

AI Horde 是一个众包分布式集群,由图像生成工作者和文本生成工作者组成。

AI Horde 需要使用 API 密钥,这款移动应用程序允许使用默认 API 密钥(即“0000000000”)或输入您自己的密钥。您可以注册并获取自己的 AI Horde API 密钥这里

Hugging Face Inference API 允许通过简单的 HTTP 请求测试和评估超过 150,000 个公开可访问的机器学习模型,或者您自己的私有模型,快速推理托管在 Hugging Face 共享基础设施上。该服务是免费的,但受到速率限制。

Hugging Face Inference 需要使用 API 密钥,可以在 Hugging Face 账户设置 中创建。

OpenAI提供了一个使用DALLE-2DALLE-3模型进行文本到图像生成的服务。该服务是付费的。

OpenAI 需要使用 API 密钥,可以在OpenAI API 密钥设置中创建。

StabilityAI 是 DreamStudio 提供的图像生成服务。

StabilityAI 需要使用 API 密钥,可以在 API 密钥页面 中创建。

仅支持 txt2img 模式。

允许使用手机资源生成图像。

应用程序使用操作系统默认设置提供的语言。

应用程序的用户界面已翻译成此表中列出的语言:

语言

自版本

状态

英语

0.1.0

翻译好的文字

乌克兰语

0.1.0

翻译好的文字

土耳其语

0.4.1

翻译好的文字

俄语

0.5.5

翻译好的文字

简体中文

0.6.2

翻译好的文字

欢迎对翻译做出贡献。

由于 Google Play 有一些应用必须遵守的政策,才能被允许在 Google Play 上发布,因此通过 Google Play 和 F-Droid/GitHub 发布的版本之间存在一些差异,列在下表中:

特性

Google Play构建

F-Droid/GitHub 构建

原因

侧向加载 LocalDiffusion 自定义模型

Google Play 不允许发布带有 android.permission.MANAGE_EXTERNAL_STORAGE 权限的应用程序,该权限用于直接从外部存储读取自定义模型文件。

这个软件是开源的,不提供任何保修,并且欢迎您免费使用。

如果您觉得这个软件有价值,并且想要表示感谢并给予一点支持,这里是按钮:

"Buy Me A Coffee"

总结
Stable Diffusion AI是一个易于使用的应用程序,可以让您通过几次点击快速从文本或其他图像生成图像。该应用程序支持使用多种服务器环境,包括AI Horde、Stable-Diffusion-WebUI、SwarmUI、Hugging Face Inference API、OpenAI和Stability AI等。除了支持Txt2Img和Img2Img模式外,还提供了许多功能,如动态尺寸、不同的采样方法、种子输入、采样步骤、CFG比例、恢复面孔选项等。此外,应用还提供了本地环境支持、图库展示、设置选项等功能。用户需要在运行AUTOMATIC1111 WebUI的服务器模式下使用该应用。如果无法运行服务器实例,可以在服务器设置页面上切换到演示模式,以便测试应用。