太乙是首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练,参数数量高达1B。
温馨提示:点击“应用介绍”边上的 【图生图(卡通) API】 【文生图(卡通) API】 【图生图 API】 【文生图 API】 可以查看对应的接口信息。包括接口的参数,费用以及相关的案例等;
本应用包括 8 个模型,均来在 ModelScope,并由第三方托管在 AIGCaaS 平台
“封神榜模型”将全方面的开源一系列NLP相关的预训练大模型。NLP社区中有着广泛的研究任务,这些任务可以被分为两类:通用任务和特殊任务。前者包括了自然语言理解(NLU),自然语言生成(NLG)和自然语言转换(NLT)任务。后者涵盖了多模态,特定领域等任务。我们考虑了所有的这些任务,并且提供了在下游任务上微调好的相关模型,这使得计算资源有限的用户也可以轻松使用我们的基础模型。而且我们承诺,将对这些模型做持续的升级,不断融合最新的数据和最新的训练算法。通过IDEA研究院的努力,打造中文认知智能的通用基础设施,避免重复建设,为全社会节省算力。
同时,“封神榜”也希望各个公司、高校、机构加入到这个开源计划中,一起共建大模型开源体系。未来,当我们需要一个新的预训练模型,都应该是首先从这些开源大模型中选取一个最接近的,做继续训练,然后再把新的模型开源回这个体系。这样,每个人用最少的算力,就能得到自己的模型,同时这个开源大模型体系也能越来越大。
太乙系列模型主要应用于跨模态场景,包括文本图像生成,蛋白质结构预测, 语音-文本表示等。2022年11月1日,封神榜开源了第一个中文版本的 stable diffusion 模型“太乙 Stable Diffusion”。
当前应用包括了:
需求 Demand | 任务 Task | 系列 Series | 模型 Model | 参数 Parameter | 额外 Extra |
---|---|---|---|---|---|
特殊 Special | 多模态 Multimodal | 太乙 Taiyi | Stable Diffusion | 1B | Chinese |
需求 Demand | 任务 Task | 系列 Series | 模型 Model | 参数 Parameter | 额外 Extra |
---|---|---|---|---|---|
特殊 Special | 多模态 Multimodal | 太乙 Taiyi | Stable Diffusion | 1B | Chinese |
铁马冰河入梦来,3D绘画。 | 飞流直下三千尺,油画。 | 女孩背影,日落,唯美插画。 |
---|---|---|
![]() |
![]() |
![]() |
1个女孩,绿色头发,毛衣,看向阅图者,上半身,帽子,户外,下雪,高领毛衣 | 户外,天空,云,蓝天,无人,多云的天空,风景,日出,草原 | 建筑,科幻,城市,城市风景,摩天大楼,赛博朋克,人群 |
---|---|---|
![]() |
![]() |
![]() |
温馨提示:
1. 本平台所提供 API 会产生相对应的金币消耗,这部分金币消耗是用于 API 调用时的 GPU 资源消耗,并非模型服务本身费用,模型均为开源模型,由第三方免费托管至本平台,如由第三方存在侵权行为等,请联系客服微信(B063-1206)进行处理;
2. 本平台在文章中可能会涉及到最佳实践,最佳案例以及相关带有"最"的描述,均指的是限定在本平台内,而非行业,不具有排他性;例如某文章如果说"这个实践操作可以算是最佳实践了"指的是仅限在当前平台内(AIGCaaS)中算是最佳实践,所以请各位在阅读时仔细辨别。另外,此处所说的"最佳"、"最"仅为举例,并不仅局限于这几个词,而是所有的类似词汇。
总用量:12 次
图生图 API,通过上传图片信息与文本描述可以获得对应的图片处理结果
请求地址
请求方式
请求参数
参数名 | 类型 | 位置 | 解释 |
---|---|---|---|
Nonce | string | headers | 防重放配置 随机字符串(最大长度64位,推荐20位)且10秒内不可重复 |
Timestamp | string | headers | 发起请求时间戳 与服务器时间差小于10秒 |
SecretID | string | headers | 密钥信息 密钥配置中的 secret_id 配置 |
Token | string | headers | 签名结果 sha256(Timestamp, SecretKey, Nonce) |
init_images | string | body | 图片 初始化图片,数组格式,例如["图片1", "图片2"],每个图片字符串为图片的 Base64 编码,不需要包括图片描述信息,例如“data:image/png;base64” |
resize_mode | number | body | 缩放模式 缩放模式功能其实是指将素材区域的图片以什么样的方式进行加载,每一种加载方式都会影响输出的图像尺寸结果。取值从0到3,分别表示拉伸/Just Resize(简单的将图片缩放至指定比例,不保证原图尺寸比),裁剪/Crop And Resize(将图片按比例进行缩放,多余的直接裁剪掉),填充/Resize And Fill(图片按比例进行缩放,缺少的部分填充),隐空间直接缩放/Latent upScale(其实与前面三个不同,这个是常用于图像超分辨率的快捷选项,低显存谨慎使用) |
prompt | string | body | 提示词 绘画的文本描述(支持中文和英文描述),所支持的 lora 可以参考案例列表:https://www.aigcaas.cn/category/13.html |
width | integer | body | 图片宽度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
height | integer | body | 图片高度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
negative_prompt | string | body | 反面描述内容 反面描述内容 |
sampler_index | string | body | 采样方法 采样方法,默认为Euler,其他可选参数:Euler a,Euler,LMS,Heun,DPM2,DPM2 a,DPM++ 2S a,DPM++ 2M,DPM++ SDE,DPM++ 2M SDE,DPM fast,DPM adaptive,LMS Karras,DPM2 Karras,DPM2 a Karras,DPM++ 2S a Karras,DPM++ 2M Karras,DPM++ SDE Karras,DPM++ 2M SDE Karras,DDIM,PLMS,UniPC |
steps | number | body | 生成步数 生成步数,默认50,通常20步到25步左右最为合适 |
seed | number | body | 随机种子数 控制生成图片是否可复现,用于在潜空间中生成最张量的种子,控制图像的内容,每生成一个图像都有自己的种子值,默认为-1 |
mask | string | body | 遮罩 遮罩参数,需要时图片的 Base64 格式,但不需要包括图片描述信息,例如“data:image/png;base64” |
mask_blur | number | body | 遮罩/蒙版模糊 遮罩/蒙版模糊参数,默认为4 |
inpainting_fill | number | body | 蒙版遮住的内容 蒙版遮住的内容, 0填充, 1原图 2潜空间噪声 3潜空间数值零 |
inpaint_full_res | string | body | 修补区 修复区域,false:整个图片,true:仅蒙版;默认为true |
inpaint_full_res_padding | string | body | 修补区内边距 修补区内边距,默认为0 |
inpainting_mask_invert | string | body | 蒙版模式 蒙版模式 0表示重绘蒙版内容,1表示重绘非蒙版内容,默认为0 |
restore_faces | boolean | body | 恢复面部缺陷 应用了额外模型,该模型可以恢复面部缺陷,默认为 false |
subseed | number | body | 附加种子值 附加种子值,测试更多种子码变化之用 |
subseed_strength | number | body | 种子和variation seed之间的差值程度 种子和variation seed之间的差值程度,如果生成了两张图,可以通过第一个图为seed,第二个图为subseed,然后设置subseed strength在0-1之间的强度变化,那么会生成逐渐过渡的两个图。 |
seed_resize_from_w | number | body | seed_resize_from_w 对应 UI 界面的 Resize seed from width;默认为-1 |
seed_resize_from_h | number | body | seed_resize_from_h 对应 UI 界面的 Resize seed from height;默认为-1 |
cfg_scale | number | body | CFG AI生图与你给的提示词的相关度,数值越高越会按照你说的内容下去生图。控制模型和prompt的匹配程度,1.忽视prompt, 3.更有创意,7,在prompt和freedom中取得平衡,15,遵守prompt,30,严格按照prompt |
eta | number | body | 噪声种子 噪声种子(取值范围0.0-1.0) |
styles | string | body | 风格 风格参数,格式为["string"] |
denoising_strength | number | body | 降噪强度 降噪强度,取值范围是0-1,默认设置0.75。取值越大,说明图片变化越大,0表示图片几乎不变,1表示可能严重偏离原图。一般将该参数设置在0.6~0.8范围; |
hr_scale | number | body | 缩放系数 缩放系数;默认为2 |
tiling | string | body | 可平埔 生成可以平铺的周期性图像,默认为false |
script_name | string | body | 脚本/命令名称 取值有prompt matrix(会生出一个表格图片,用于比对不同提示词生图的效果), prompts from file or textbox(从写好提示词的文件生成图片), x/y/z plot(用于比对不同提示词、采样方法、CFG Scale、种子码的组合所生图的效果),通常与脚本/命令参数(script_args)搭配使用 |
script_args | string | body | 脚本/命令参数 一般用于 lor a模型或其他插件参数,例如:[0, true, true, "LoRA", "dingzhenlora_v1(fa7c1732cc95)", 1, 1] |
帮助详情
模型效果与案例请查看应用介绍
注意:为了让更多 Stable Diffusion WebUI 的用户可以快速与当前 API 兼容,所以当前 API 遵守了 Stable Diffusion WebUI 的规范,即参数的输入输出,都是和 Stable Diffusion WebUI 所暴露的参数保持一致:
1. 入参的具体参数和参数详情可以完全参考 Stable Diffusion WebUI
2. 输出结果中的图片参数,数一个数组,如果只有一张图则数组长度为1,如果有 n 张图,数组长度为 n,每个元素为图片 Base64 编码(需要用户手动补全 Base64 编码的图像标记data:image/png;base64,
)
图生图 API,通过上传图片信息与文本描述可以获得对应的图片处理结果。
在模型参数部分,尽管已经提供了大量的参数可供在线调试,但是这些参数依旧不完整,完整参数列表可以参考以下参数内容
{
"init_images": [
"string"
],
"resize_mode": 0,
"denoising_strength": 0.75,
"image_cfg_scale": 0,
"mask": "string",
"mask_blur": 4,
"inpainting_fill": 0,
"inpaint_full_res": true,
"inpaint_full_res_padding": 0,
"inpainting_mask_invert": 0,
"initial_noise_multiplier": 0,
"prompt": "",
"styles": [
"string"
],
"seed": -1,
"subseed": -1,
"subseed_strength": 0,
"seed_resize_from_h": -1,
"seed_resize_from_w": -1,
"sampler_name": "string",
"batch_size": 1,
"n_iter": 1,
"steps": 50,
"cfg_scale": 7,
"width": 512,
"height": 512,
"restore_faces": false,
"tiling": false,
"do_not_save_samples": false,
"do_not_save_grid": false,
"negative_prompt": "string",
"eta": 0,
"s_min_uncond": 0,
"s_churn": 0,
"s_tmax": 0,
"s_tmin": 0,
"s_noise": 1,
"override_settings": {},
"override_settings_restore_afterwards": true,
"script_args": [],
"sampler_index": "Euler",
"include_init_images": false,
"script_name": "string",
"send_images": true,
"save_images": false,
"alwayson_scripts": {}
}
如果执行成功获得到对应结果,对应输出结构为:
{
"images": [
"string"
],
"parameters": {},
"info": "string"
}
更多关于 ControlNet,Lora 以及 Tagger 等相关插件的描述,可以参考Stable Diffusion 扩展文档
温馨提示:
1. 本平台所提供 API 会产生相对应的金币消耗,这部分金币消耗是用于 API 调用时的 GPU 资源消耗,并非模型服务本身费用,模型均为开源模型,由第三方免费托管至本平台,如由第三方存在侵权行为等,请联系客服微信(B063-1206)进行处理;
2. 本平台在文章中可能会涉及到最佳实践,最佳案例以及相关带有"最"的描述,均指的是限定在本平台内,而非行业,不具有排他性;例如某文章如果说"这个实践操作可以算是最佳实践了"指的是仅限在当前平台内(AIGCaaS)中算是最佳实践,所以请各位在阅读时仔细辨别。另外,此处所说的"最佳"、"最"仅为举例,并不仅局限于这几个词,而是所有的类似词汇。
总用量:119 次
文生图 API,通过上传文本信息可以获得对应的图片内容
请求地址
请求方式
请求参数
参数名 | 类型 | 位置 | 解释 |
---|---|---|---|
Nonce | string | headers | 防重放配置 随机字符串(最大长度64位,推荐20位)且10秒内不可重复 |
Timestamp | string | headers | 发起请求时间戳 与服务器时间差小于10秒 |
SecretID | string | headers | 密钥信息 密钥配置中的 secret_id 配置 |
Token | string | headers | 签名结果 sha256(Timestamp, SecretKey, Nonce) |
prompt | string | body | 提示词 绘画的文本描述(支持中文和英文描述),所支持的 lora 可以参考案例列表:https://www.aigcaas.cn/category/13.html |
width | integer | body | 图片宽度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
height | integer | body | 图片高度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
negative_prompt | string | body | 反面描述内容 反面描述内容 |
sampler_index | string | body | 采样方法 采样方法,默认为Euler,其他可选参数:Euler a,Euler,LMS,Heun,DPM2,DPM2 a,DPM++ 2S a,DPM++ 2M,DPM++ SDE,DPM++ 2M SDE,DPM fast,DPM adaptive,LMS Karras,DPM2 Karras,DPM2 a Karras,DPM++ 2S a Karras,DPM++ 2M Karras,DPM++ SDE Karras,DPM++ 2M SDE Karras,DDIM,PLMS,UniPC |
steps | number | body | 生成步数 生成步数,默认50,通常20步到25步左右最为合适 |
seed | number | body | 随机种子数 控制生成图片是否可复现,用于在潜空间中生成最张量的种子,控制图像的内容,每生成一个图像都有自己的种子值,默认为-1 |
restore_faces | boolean | body | 恢复面部缺陷 应用了额外模型,该模型可以恢复面部缺陷,默认为 false |
subseed | number | body | 附加种子值 附加种子值,测试更多种子码变化之用 |
subseed_strength | number | body | 种子和variation seed之间的差值程度 种子和variation seed之间的差值程度,如果生成了两张图,可以通过第一个图为seed,第二个图为subseed,然后设置subseed strength在0-1之间的强度变化,那么会生成逐渐过渡的两个图。 |
seed_resize_from_w | number | body | seed_resize_from_w 对应 UI 界面的 Resize seed from width;默认为-1 |
seed_resize_from_h | number | body | seed_resize_from_h 对应 UI 界面的 Resize seed from height;默认为-1 |
cfg_scale | number | body | CFG AI生图与你给的提示词的相关度,数值越高越会按照你说的内容下去生图。控制模型和prompt的匹配程度,1.忽视prompt, 3.更有创意,7,在prompt和freedom中取得平衡,15,遵守prompt,30,严格按照prompt |
eta | number | body | 噪声种子 噪声种子(取值范围0.0-1.0) |
styles | string | body | 风格 风格参数,格式为["string"] |
enable_hr | boolean | body | 高清修复(Hires. fix) 可以提升图片的画质,但是会耗费更多VRAM |
denoising_strength | number | body | 降噪强度 降噪强度,取值范围是0-1,默认设置0.75。取值越大,说明图片变化越大,0表示图片几乎不变,1表示可能严重偏离原图。一般将该参数设置在0.6~0.8范围; |
hr_scale | number | body | 缩放系数 缩放系数;默认为2 |
hr_upscaler | string | body | 要使用的放大器 高清修复模式下要使用的放大器 |
hr_second_pass_steps | number | body | 高清修复步数 高清修复步数 |
hr_resize_x | number | body | 高清修复制定尺寸 x 高清修复制定尺寸 x |
hr_resize_y | number | body | 高清修复制定尺寸 y 高清修复制定尺寸 y |
hr_prompt | string | body | 高清修复提示词 高清修复提示词 |
hr_negative_prompt | string | body | 高清修复反面描述内容 高清修复反面描述内容 |
tiling | string | body | 可平埔 生成可以平铺的周期性图像,默认为false |
script_name | string | body | 脚本/命令名称 取值有prompt matrix(会生出一个表格图片,用于比对不同提示词生图的效果), prompts from file or textbox(从写好提示词的文件生成图片), x/y/z plot(用于比对不同提示词、采样方法、CFG Scale、种子码的组合所生图的效果),通常与脚本/命令参数(script_args)搭配使用 |
script_args | string | body | 脚本/命令参数 一般用于 lor a模型或其他插件参数,例如:[0, true, true, "LoRA", "dingzhenlora_v1(fa7c1732cc95)", 1, 1] |
帮助详情
模型效果与案例请查看应用介绍
注意:为了让更多 Stable Diffusion WebUI 的用户可以快速与当前 API 兼容,所以当前 API 遵守了 Stable Diffusion WebUI 的规范,即参数的输入输出,都是和 Stable Diffusion WebUI 所暴露的参数保持一致:
1. 入参的具体参数和参数详情可以完全参考 Stable Diffusion WebUI
2. 输出结果中的图片参数,数一个数组,如果只有一张图则数组长度为1,如果有 n 张图,数组长度为 n,每个元素为图片 Base64 编码(需要用户手动补全 Base64 编码的图像标记data:image/png;base64,
)
3. 为了让当前模型更有可玩性,当前模型支持 ControlNet 插件,并可以通过当前 API 直接使用
文生图 API,通过上传文本信息可以获得对应的图片内容。
在模型参数部分,尽管已经提供了大量的参数可供在线调试,但是这些参数依旧不完整,完整参数列表可以参考以下参数内容
{
"enable_hr": false,
"denoising_strength": 0,
"firstphase_width": 0,
"firstphase_height": 0,
"hr_scale": 2,
"hr_upscaler": "string",
"hr_second_pass_steps": 0,
"hr_resize_x": 0,
"hr_resize_y": 0,
"hr_sampler_name": "string",
"hr_prompt": "",
"hr_negative_prompt": "",
"prompt": "",
"styles": [
"string"
],
"seed": -1,
"subseed": -1,
"subseed_strength": 0,
"seed_resize_from_h": -1,
"seed_resize_from_w": -1,
"sampler_name": "string",
"batch_size": 1,
"n_iter": 1,
"steps": 50,
"cfg_scale": 7,
"width": 512,
"height": 512,
"restore_faces": false,
"tiling": false,
"do_not_save_samples": false,
"do_not_save_grid": false,
"negative_prompt": "string",
"eta": 0,
"s_min_uncond": 0,
"s_churn": 0,
"s_tmax": 0,
"s_tmin": 0,
"s_noise": 1,
"override_settings": {},
"override_settings_restore_afterwards": true,
"script_args": [],
"sampler_index": "Euler",
"script_name": "string",
"send_images": true,
"save_images": false,
"alwayson_scripts": {}
}
如果执行成功获得到对应结果,对应输出结构为:
{
"images": [
"string"
],
"parameters": {},
"info": "string"
}
更多关于 ControlNet,Lora 以及 Tagger 等相关插件的描述,可以参考Stable Diffusion 扩展文档
温馨提示:
1. 本平台所提供 API 会产生相对应的金币消耗,这部分金币消耗是用于 API 调用时的 GPU 资源消耗,并非模型服务本身费用,模型均为开源模型,由第三方免费托管至本平台,如由第三方存在侵权行为等,请联系客服微信(B063-1206)进行处理;
2. 本平台在文章中可能会涉及到最佳实践,最佳案例以及相关带有"最"的描述,均指的是限定在本平台内,而非行业,不具有排他性;例如某文章如果说"这个实践操作可以算是最佳实践了"指的是仅限在当前平台内(AIGCaaS)中算是最佳实践,所以请各位在阅读时仔细辨别。另外,此处所说的"最佳"、"最"仅为举例,并不仅局限于这几个词,而是所有的类似词汇。
总用量:10 次
图生图 API,通过上传图片信息与文本描述可以获得对应的图片处理结果
请求地址
请求方式
请求参数
参数名 | 类型 | 位置 | 解释 |
---|---|---|---|
Nonce | string | headers | 防重放配置 随机字符串(最大长度64位,推荐20位)且10秒内不可重复 |
Timestamp | string | headers | 发起请求时间戳 与服务器时间差小于10秒 |
SecretID | string | headers | 密钥信息 密钥配置中的 secret_id 配置 |
Token | string | headers | 签名结果 sha256(Timestamp, SecretKey, Nonce) |
init_images | string | body | 图片 初始化图片,数组格式,例如["图片1", "图片2"],每个图片字符串为图片的 Base64 编码,不需要包括图片描述信息,例如“data:image/png;base64” |
resize_mode | number | body | 缩放模式 缩放模式功能其实是指将素材区域的图片以什么样的方式进行加载,每一种加载方式都会影响输出的图像尺寸结果。取值从0到3,分别表示拉伸/Just Resize(简单的将图片缩放至指定比例,不保证原图尺寸比),裁剪/Crop And Resize(将图片按比例进行缩放,多余的直接裁剪掉),填充/Resize And Fill(图片按比例进行缩放,缺少的部分填充),隐空间直接缩放/Latent upScale(其实与前面三个不同,这个是常用于图像超分辨率的快捷选项,低显存谨慎使用) |
prompt | string | body | 提示词 绘画的文本描述(支持中文和英文描述),所支持的 lora 可以参考案例列表:https://www.aigcaas.cn/category/13.html |
width | integer | body | 图片宽度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
height | integer | body | 图片高度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
negative_prompt | string | body | 反面描述内容 反面描述内容 |
sampler_index | string | body | 采样方法 采样方法,默认为Euler,其他可选参数:Euler a,Euler,LMS,Heun,DPM2,DPM2 a,DPM++ 2S a,DPM++ 2M,DPM++ SDE,DPM++ 2M SDE,DPM fast,DPM adaptive,LMS Karras,DPM2 Karras,DPM2 a Karras,DPM++ 2S a Karras,DPM++ 2M Karras,DPM++ SDE Karras,DPM++ 2M SDE Karras,DDIM,PLMS,UniPC |
steps | number | body | 生成步数 生成步数,默认50,通常20步到25步左右最为合适 |
seed | number | body | 随机种子数 控制生成图片是否可复现,用于在潜空间中生成最张量的种子,控制图像的内容,每生成一个图像都有自己的种子值,默认为-1 |
mask | string | body | 遮罩 遮罩参数,需要时图片的 Base64 格式,但不需要包括图片描述信息,例如“data:image/png;base64” |
mask_blur | number | body | 遮罩/蒙版模糊 遮罩/蒙版模糊参数,默认为4 |
inpainting_fill | number | body | 蒙版遮住的内容 蒙版遮住的内容, 0填充, 1原图 2潜空间噪声 3潜空间数值零 |
inpaint_full_res | string | body | 修补区 修复区域,false:整个图片,true:仅蒙版;默认为true |
inpaint_full_res_padding | string | body | 修补区内边距 修补区内边距,默认为0 |
inpainting_mask_invert | string | body | 蒙版模式 蒙版模式 0表示重绘蒙版内容,1表示重绘非蒙版内容,默认为0 |
restore_faces | boolean | body | 恢复面部缺陷 应用了额外模型,该模型可以恢复面部缺陷,默认为 false |
subseed | number | body | 附加种子值 附加种子值,测试更多种子码变化之用 |
subseed_strength | number | body | 种子和variation seed之间的差值程度 种子和variation seed之间的差值程度,如果生成了两张图,可以通过第一个图为seed,第二个图为subseed,然后设置subseed strength在0-1之间的强度变化,那么会生成逐渐过渡的两个图。 |
seed_resize_from_w | number | body | seed_resize_from_w 对应 UI 界面的 Resize seed from width;默认为-1 |
seed_resize_from_h | number | body | seed_resize_from_h 对应 UI 界面的 Resize seed from height;默认为-1 |
cfg_scale | number | body | CFG AI生图与你给的提示词的相关度,数值越高越会按照你说的内容下去生图。控制模型和prompt的匹配程度,1.忽视prompt, 3.更有创意,7,在prompt和freedom中取得平衡,15,遵守prompt,30,严格按照prompt |
eta | number | body | 噪声种子 噪声种子(取值范围0.0-1.0) |
styles | string | body | 风格 风格参数,格式为["string"] |
denoising_strength | number | body | 降噪强度 降噪强度,取值范围是0-1,默认设置0.75。取值越大,说明图片变化越大,0表示图片几乎不变,1表示可能严重偏离原图。一般将该参数设置在0.6~0.8范围; |
hr_scale | number | body | 缩放系数 缩放系数;默认为2 |
tiling | string | body | 可平埔 生成可以平铺的周期性图像,默认为false |
script_name | string | body | 脚本/命令名称 取值有prompt matrix(会生出一个表格图片,用于比对不同提示词生图的效果), prompts from file or textbox(从写好提示词的文件生成图片), x/y/z plot(用于比对不同提示词、采样方法、CFG Scale、种子码的组合所生图的效果),通常与脚本/命令参数(script_args)搭配使用 |
script_args | string | body | 脚本/命令参数 一般用于 lor a模型或其他插件参数,例如:[0, true, true, "LoRA", "dingzhenlora_v1(fa7c1732cc95)", 1, 1] |
帮助详情
模型效果与案例请查看应用介绍
注意:为了让更多 Stable Diffusion WebUI 的用户可以快速与当前 API 兼容,所以当前 API 遵守了 Stable Diffusion WebUI 的规范,即参数的输入输出,都是和 Stable Diffusion WebUI 所暴露的参数保持一致:
1. 入参的具体参数和参数详情可以完全参考 Stable Diffusion WebUI
2. 输出结果中的图片参数,数一个数组,如果只有一张图则数组长度为1,如果有 n 张图,数组长度为 n,每个元素为图片 Base64 编码(需要用户手动补全 Base64 编码的图像标记data:image/png;base64,
)
图生图 API,通过上传图片信息与文本描述可以获得对应的图片处理结果。
在模型参数部分,尽管已经提供了大量的参数可供在线调试,但是这些参数依旧不完整,完整参数列表可以参考以下参数内容
{
"init_images": [
"string"
],
"resize_mode": 0,
"denoising_strength": 0.75,
"image_cfg_scale": 0,
"mask": "string",
"mask_blur": 4,
"inpainting_fill": 0,
"inpaint_full_res": true,
"inpaint_full_res_padding": 0,
"inpainting_mask_invert": 0,
"initial_noise_multiplier": 0,
"prompt": "",
"styles": [
"string"
],
"seed": -1,
"subseed": -1,
"subseed_strength": 0,
"seed_resize_from_h": -1,
"seed_resize_from_w": -1,
"sampler_name": "string",
"batch_size": 1,
"n_iter": 1,
"steps": 50,
"cfg_scale": 7,
"width": 512,
"height": 512,
"restore_faces": false,
"tiling": false,
"do_not_save_samples": false,
"do_not_save_grid": false,
"negative_prompt": "string",
"eta": 0,
"s_min_uncond": 0,
"s_churn": 0,
"s_tmax": 0,
"s_tmin": 0,
"s_noise": 1,
"override_settings": {},
"override_settings_restore_afterwards": true,
"script_args": [],
"sampler_index": "Euler",
"include_init_images": false,
"script_name": "string",
"send_images": true,
"save_images": false,
"alwayson_scripts": {}
}
如果执行成功获得到对应结果,对应输出结构为:
{
"images": [
"string"
],
"parameters": {},
"info": "string"
}
更多关于 ControlNet,Lora 以及 Tagger 等相关插件的描述,可以参考Stable Diffusion 扩展文档
温馨提示:
1. 本平台所提供 API 会产生相对应的金币消耗,这部分金币消耗是用于 API 调用时的 GPU 资源消耗,并非模型服务本身费用,模型均为开源模型,由第三方免费托管至本平台,如由第三方存在侵权行为等,请联系客服微信(B063-1206)进行处理;
2. 本平台在文章中可能会涉及到最佳实践,最佳案例以及相关带有"最"的描述,均指的是限定在本平台内,而非行业,不具有排他性;例如某文章如果说"这个实践操作可以算是最佳实践了"指的是仅限在当前平台内(AIGCaaS)中算是最佳实践,所以请各位在阅读时仔细辨别。另外,此处所说的"最佳"、"最"仅为举例,并不仅局限于这几个词,而是所有的类似词汇。
总用量:85 次
文生图 API,通过上传文本信息可以获得对应的图片内容
请求地址
请求方式
请求参数
参数名 | 类型 | 位置 | 解释 |
---|---|---|---|
Nonce | string | headers | 防重放配置 随机字符串(最大长度64位,推荐20位)且10秒内不可重复 |
Timestamp | string | headers | 发起请求时间戳 与服务器时间差小于10秒 |
SecretID | string | headers | 密钥信息 密钥配置中的 secret_id 配置 |
Token | string | headers | 签名结果 sha256(Timestamp, SecretKey, Nonce) |
prompt | string | body | 提示词 绘画的文本描述(支持中文和英文描述),所支持的 lora 可以参考案例列表:https://www.aigcaas.cn/category/13.html |
width | integer | body | 图片宽度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
height | integer | body | 图片高度 图片宽度,默认为512,一般情况下,尺寸越大品质越好,但是会更慢,而且会影响构图,例如一个人两个头等,推荐最大尺寸1080 |
negative_prompt | string | body | 反面描述内容 反面描述内容 |
sampler_index | string | body | 采样方法 采样方法,默认为Euler,其他可选参数:Euler a,Euler,LMS,Heun,DPM2,DPM2 a,DPM++ 2S a,DPM++ 2M,DPM++ SDE,DPM++ 2M SDE,DPM fast,DPM adaptive,LMS Karras,DPM2 Karras,DPM2 a Karras,DPM++ 2S a Karras,DPM++ 2M Karras,DPM++ SDE Karras,DPM++ 2M SDE Karras,DDIM,PLMS,UniPC |
steps | number | body | 生成步数 生成步数,默认50,通常20步到25步左右最为合适 |
seed | number | body | 随机种子数 控制生成图片是否可复现,用于在潜空间中生成最张量的种子,控制图像的内容,每生成一个图像都有自己的种子值,默认为-1 |
restore_faces | boolean | body | 恢复面部缺陷 应用了额外模型,该模型可以恢复面部缺陷,默认为 false |
subseed | number | body | 附加种子值 附加种子值,测试更多种子码变化之用 |
subseed_strength | number | body | 种子和variation seed之间的差值程度 种子和variation seed之间的差值程度,如果生成了两张图,可以通过第一个图为seed,第二个图为subseed,然后设置subseed strength在0-1之间的强度变化,那么会生成逐渐过渡的两个图。 |
seed_resize_from_w | number | body | seed_resize_from_w 对应 UI 界面的 Resize seed from width;默认为-1 |
seed_resize_from_h | number | body | seed_resize_from_h 对应 UI 界面的 Resize seed from height;默认为-1 |
cfg_scale | number | body | CFG AI生图与你给的提示词的相关度,数值越高越会按照你说的内容下去生图。控制模型和prompt的匹配程度,1.忽视prompt, 3.更有创意,7,在prompt和freedom中取得平衡,15,遵守prompt,30,严格按照prompt |
eta | number | body | 噪声种子 噪声种子(取值范围0.0-1.0) |
styles | string | body | 风格 风格参数,格式为["string"] |
enable_hr | boolean | body | 高清修复(Hires. fix) 可以提升图片的画质,但是会耗费更多VRAM |
denoising_strength | number | body | 降噪强度 降噪强度,取值范围是0-1,默认设置0.75。取值越大,说明图片变化越大,0表示图片几乎不变,1表示可能严重偏离原图。一般将该参数设置在0.6~0.8范围; |
hr_scale | number | body | 缩放系数 缩放系数;默认为2 |
hr_upscaler | string | body | 要使用的放大器 高清修复模式下要使用的放大器 |
hr_second_pass_steps | number | body | 高清修复步数 高清修复步数 |
hr_resize_x | number | body | 高清修复制定尺寸 x 高清修复制定尺寸 x |
hr_resize_y | number | body | 高清修复制定尺寸 y 高清修复制定尺寸 y |
hr_prompt | string | body | 高清修复提示词 高清修复提示词 |
hr_negative_prompt | string | body | 高清修复反面描述内容 高清修复反面描述内容 |
tiling | string | body | 可平埔 生成可以平铺的周期性图像,默认为false |
script_name | string | body | 脚本/命令名称 取值有prompt matrix(会生出一个表格图片,用于比对不同提示词生图的效果), prompts from file or textbox(从写好提示词的文件生成图片), x/y/z plot(用于比对不同提示词、采样方法、CFG Scale、种子码的组合所生图的效果),通常与脚本/命令参数(script_args)搭配使用 |
script_args | string | body | 脚本/命令参数 一般用于 lor a模型或其他插件参数,例如:[0, true, true, "LoRA", "dingzhenlora_v1(fa7c1732cc95)", 1, 1] |
帮助详情
模型效果与案例请查看应用介绍
注意:为了让更多 Stable Diffusion WebUI 的用户可以快速与当前 API 兼容,所以当前 API 遵守了 Stable Diffusion WebUI 的规范,即参数的输入输出,都是和 Stable Diffusion WebUI 所暴露的参数保持一致:
1. 入参的具体参数和参数详情可以完全参考 Stable Diffusion WebUI
2. 输出结果中的图片参数,数一个数组,如果只有一张图则数组长度为1,如果有 n 张图,数组长度为 n,每个元素为图片 Base64 编码(需要用户手动补全 Base64 编码的图像标记data:image/png;base64,
)
3. 为了让当前模型更有可玩性,当前模型支持 ControlNet 插件,并可以通过当前 API 直接使用
文生图 API,通过上传文本信息可以获得对应的图片内容。
在模型参数部分,尽管已经提供了大量的参数可供在线调试,但是这些参数依旧不完整,完整参数列表可以参考以下参数内容
{
"enable_hr": false,
"denoising_strength": 0,
"firstphase_width": 0,
"firstphase_height": 0,
"hr_scale": 2,
"hr_upscaler": "string",
"hr_second_pass_steps": 0,
"hr_resize_x": 0,
"hr_resize_y": 0,
"hr_sampler_name": "string",
"hr_prompt": "",
"hr_negative_prompt": "",
"prompt": "",
"styles": [
"string"
],
"seed": -1,
"subseed": -1,
"subseed_strength": 0,
"seed_resize_from_h": -1,
"seed_resize_from_w": -1,
"sampler_name": "string",
"batch_size": 1,
"n_iter": 1,
"steps": 50,
"cfg_scale": 7,
"width": 512,
"height": 512,
"restore_faces": false,
"tiling": false,
"do_not_save_samples": false,
"do_not_save_grid": false,
"negative_prompt": "string",
"eta": 0,
"s_min_uncond": 0,
"s_churn": 0,
"s_tmax": 0,
"s_tmin": 0,
"s_noise": 1,
"override_settings": {},
"override_settings_restore_afterwards": true,
"script_args": [],
"sampler_index": "Euler",
"script_name": "string",
"send_images": true,
"save_images": false,
"alwayson_scripts": {}
}
如果执行成功获得到对应结果,对应输出结构为:
{
"images": [
"string"
],
"parameters": {},
"info": "string"
}
更多关于 ControlNet,Lora 以及 Tagger 等相关插件的描述,可以参考Stable Diffusion 扩展文档
温馨提示:
1. 本平台所提供 API 会产生相对应的金币消耗,这部分金币消耗是用于 API 调用时的 GPU 资源消耗,并非模型服务本身费用,模型均为开源模型,由第三方免费托管至本平台,如由第三方存在侵权行为等,请联系客服微信(B063-1206)进行处理;
2. 本平台在文章中可能会涉及到最佳实践,最佳案例以及相关带有"最"的描述,均指的是限定在本平台内,而非行业,不具有排他性;例如某文章如果说"这个实践操作可以算是最佳实践了"指的是仅限在当前平台内(AIGCaaS)中算是最佳实践,所以请各位在阅读时仔细辨别。另外,此处所说的"最佳"、"最"仅为举例,并不仅局限于这几个词,而是所有的类似词汇。
粤ICP备16071783号 | Powered By aigcaas.cn
13500993691
2023年4月15日 04:17好应用