AstrBot Gemini 图像生成插件 v1.7.9
🎨 强大的 Gemini 图像生成插件,支持智能头像参考和智能表情包切分
Gemini 图像生成插件,支持生图和改图,支持自动获取头像作为参考
🎨 强大的 Gemini 图像生成插件,支持智能头像参考和智能表情包切分
您可以通过以下两种方式安装 Gemini 图像生成 插件:
进入插件目录
打开终端,并使用 cd 命令进入 AstrBot/data/plugins/ 目录。
克隆仓库
在终端中执行以下命令,将插件仓库克隆到本地:
git clone https://github.com/piexian/astrbot_plugin_gemini_image_generation
打开插件市场
在 AstrBot 的界面中,找到并进入插件市场。
搜索插件
在搜索框中输入 Gemini 图像生成。
点击安装
在搜索结果中找到该插件,并点击“安装”按钮。
在插件配置中设置以下参数:
_special: select_provider),自动读取模型/密钥/端点;不选将无法调用api_settings
provider_id:必填,从 AstrBot 提供商中选择生图模型。api_type:可选,覆盖提供商类型(google/openai/zai/grok2api)。选择 zai 时启用 Zai 兼容参数传递(顶层分辨率/比例 + generation_config);选择 grok2api 时支持相对路径图片与临时缓存图片的自动下载落盘。model:可选,覆盖提供商模型名称。vision_provider_id:可选,切图前调用视觉模型识别网格行列;留空则跳过 AI 识别。image_generation_settings
resolution:生成图像分辨率,默认 1K(可选 1K/2K/4K)。aspect_ratio:长宽比,默认 1:1。enable_sticker_split:表情包切分,默认 true。enable_sticker_zip:切分后是否打包 ZIP 发送,默认 false。preserve_reference_image_size:改图/换风格时尽量保留参考图尺寸,默认 false。enable_grounding:Gemini 搜索接地,默认 false。max_reference_images:参考图最大数量,默认 6。enable_text_response:是否同时返回文本说明,默认 false。force_resolution:强制传 image_size 参数给模型,默认 false。resolution_param_name:自定义分辨率参数名,不同 API 可能使用不同字段名(如 image_size、size、resolution),默认 image_size。aspect_ratio_param_name:自定义长宽比参数名,不同 API 可能使用不同字段名(如 aspect_ratio、aspectRatio、image_aspect_ratio),默认 aspect_ratio。quick_mode_settings
快速 指令各模式的默认分辨率/长宽比;默认值即内置默认,可直接修改。resolution / aspect_ratio 两个字段):avatar/poster/wallpaper/card/mobile/figure/sticker。retry_settings
max_attempts_per_key:每个密钥的最大重试次数,默认 3。enable_smart_retry:按错误类型智能重试/切换密钥,默认 true。total_timeout:单次调用总超时(秒),默认 120。service_settings
nap_server_address / nap_server_port:NAP 文件传输地址与端口,默认 localhost:3658。auto_avatar_reference:自动获取头像作为参考图,默认 false。verbose_logging:输出详细日志,默认 false。theme_settings.mode:帮助页主题模式 cycle/single,默认 cycle。cycle_config.day_start/day_end:白天时间段(小时),默认 6/18。cycle_config.day_template/night_template:模板文件名,默认 help_template_light / help_template_dark。single_config.template_name:单一模板文件名,默认 help_template_light。help_render_mode
html/local/text,默认 html。html:使用 t2i 网络服务渲染 HTML 模板(公共接口,可能不稳定可以自建)。local:本地 Pillow 渲染 Markdown(无需浏览器,适合资源受限环境)。text:纯文本输出(最轻量)。html_render_options(仅 html 模式生效)
quality:截图质量(1-100,留空使用默认值,仅 jpeg 格式生效)。type:截图格式,png 或 jpeg,默认 png。scale:截图缩放方式,device(更清晰)或 css(更小更快),默认 device。full_page:是否截取整页,默认 true。omit_background:是否去除背景(仅 png 有效,可生成透明背景),默认 false。limit_settings
group_limit_mode:群限制模式 none/whitelist/blacklist,默认 none。group_limit_list:群号列表(字符串)。enable_rate_limit:是否开启群内限流,默认 false。rate_limit_period:限流周期(秒),默认 60。max_requests_per_group:单群周期内最大请求数,默认 5。/生图 一只可爱的橙色小猫,坐在樱花树下,动漫风格,高清细节,杰作,细节丰富
发送图片 + /改图 把头发改成红色
发送图片 + /换风格 水彩 梦幻效果
启用 auto_avatar_reference 后,以下场景会自动获取头像:
任何生图/改图命令 + @小明群头像功能暂未实现,当前版本不会获取群头像作为参考。
# 场景1: 自动获取发言人头像
/生图 按照我生成一个动漫头像
# 结果: 获取发送者头像作为参考
# 场景2: 获取@用户头像
/改图 @小明 把头发改成蓝色
# 结果: 获取小明头像进行修改
# 场景3: 群头像功能(暂未实现)
/生图 根据本群头像设计一个logo
# 结果: 群头像功能暂未实现,不会获取群头像
# 场景4: 普通生图
/生图 一只可爱的小猫
# 结果: 纯文本生成,不获取任何头像
# 快速模式预设了最佳分辨率和比例,只需描述想要生成的内容
/快速 头像 商务风格的个人头像 # 配置: 1K分辨率,1:1比例
/快速 海报 赛博朋克游戏宣传 # 配置: 2K分辨率,16:9比例
/快速 壁纸 未来科技城市夜景 # 配置: 4K分辨率,16:9比例
/快速 卡片 简约商务风格名片 # 配置: 1K分辨率,3:2比例
/快速 手机 极简主义手机壁纸 # 配置: 2K分辨率,9:16比例
/快速 手办化 [1/2] 粘漫角色 # 配置: 2K分辨率,3:2比例,支持PVC(1)和GK(2)两种风格
/快速 表情包 Q版可爱表情 # 配置: 4K分辨率,16:9比例,LINE风格
/切图 # 对消息/引用/合并转发/群文件中的图片进行切割
说明:
1(PVC标准版)或2(树脂GK收藏版)选择风格# 发送图片后使用
/换风格 动漫
/生图帮助 # 查看当前配置和参数
本插件集成了 AstrBot 的 LLM 工具功能,允许 LLM 在对话中智能调用图像生成功能。
gemini_image_generation - Gemini 图像生成工具当用户通过自然语言请求图像生成、绘画、改图或换风格时,LLM 会自动调用此工具,例如:
Args:
prompt (string): 图像生成或修改的详细描述use_reference_images (string): 是否使用上下文中的参考图片,"true"或"false"。当用户意图是修改、变换或基于现有图片时设置为"true"include_user_avatar (string): 是否包含用户头像作为参考图像,"true"或"false"。当用户说"根据我"、"我的头像"或@某人时设置为"true"use_reference_images="true"include_user_avatar="true" 以获取对应头像作为参考此功能使 LLM 能够更智能地处理图像生成请求,无需用户记忆特定命令,通过自然语言即可实现图像生成和修改。
使用 SmartMemeSplitter 算法:
[主体描述] + [风格描述] + [细节要求] + [质量词汇]
# 好的提示词
/生图 一只白色波斯猫,蓝色大眼睛,坐在花园里,阳光透过树叶洒下,超高清,杰作,细节丰富
# 详细描述
/生图 赛博朋克风格的城市夜景,霓虹灯反射在雨后的街道上,飞行汽车穿梭于摩天大楼之间,电影级画质,写实风格
# 艺术风格
/生文 梵高风格的向日葵田,旋转的画笔,鲜艳的色彩,后印象派,油画质感
动漫风格、漫画风格、卡通写实风格、超写实、照片级水彩画、油画、素描像素艺术、8bit、复古游戏赛博朋克、蒸汽朋克、科幻中国风、和风、欧美风杰作、大师作品、精品超高清、4K、8K细节丰富、精致、精细专业摄影、电影级、宣传片选择合适分辨率
简化提示词
合理使用参考图片
问题: 使用 local 渲染模式时中文显示为方块或乱码
解决方案:
.ttf/.otf/.ttc 字体文件放入 tl/ 目录,插件会自动识别并使用问题: 生成失败,提示API错误
❌ 图像生成失败: API只返回了文本响应。请检查模型名称是否正确
解决方案:
问题: 生成时间过长
❌ 图像生成时间过长,超出了框架限制
解决方案:
问题: 无法获取头像
❌ 无法获取头像
解决方案:
/生图帮助 # 查看当前配置和参数说明
欢迎提交 Issue 和 Pull Request!
开发者请参考:新增 API 供应商(适配器开发指南)
本项目采用 MIT 许可证 - 详见 LICENSE 文件
特别感谢:
如果这个插件对你有帮助,请给个 ⭐ Star 支持一下!