见闻文章网 手机版
热门文章
  • 甘井子区举办“赋能争先 聚力攻坚”知行学堂第二期培训
    为强化春季火灾防控工作,全面提升干部群众消防安全管理能力和安全意识,3月21日,区委组织部举办“赋能争先 聚力攻坚”知行学堂第二期“消防应急”专题培训。 按照“大力支持业务骨干走上讲台”的工作要求,本次培训邀请区应急管理局党委书记、局长和区消防救援大队大队长分别以《防救结合强化基层应急管理工作》《基
  • 续航灭霸来了!7300mAh大电池+90W快充,月底发!
    近日,vivo Y300 Pro+ 配置被曝光了。此前 Y300 系列凭借出色续航与亲民价格已积累不少好口碑。Y300 Pro+的配置从处理器性能提升到影像优化,可以说是亮点十足。小雷先带大家看看外观。Y300 Pro+ 延续了前代 Y300 Pro 的全等深微四曲屏,配备 6.77 英寸屏幕,具备
  • 《落子未来》!大连新势力崛起
    今晚8点大连新闻综合频道,锁定系列纪录片《落子未来》第三集《引智聚企》,带您走进具有强大创新能力的全球独角兽企业和极具创新发展潜质的瞪羚企业,了解大连创新矩阵的重要力量,解码科技创新和产业创新深度融合。看这片科创热土如何以科技为笔以产业为卷绘就一幅中国式现代化的创新蓝图全球独角兽——不同“钒”响位于
  • 今日开票!2025 中超大连英博主场首战在即,燃爆梭鱼湾!
    来源:大连英博足球俱乐部、甘井子文旅▼▼
最新文章
  • 期待值拉满,GOODBAI快闪店亮相杭州
    潮新闻客户端 记者 张鑫五一假期首日,武林广场旁的杭州中心商场尚未开门,粉丝们已经拉满了期待值。在社交平台上,不少年轻人晒出最新笔记,杭州中心萌萌哒的毛球成了打卡热门。最近,GOODBAI旗下GOODEES杭州游牧店开到杭州,今天是对外开放的第一天。据悉,服装与生活方式品牌GOODBAI旗下IP的G
  • 2025年“汉语桥”中文比赛哥伦比亚赛区决赛落幕
    当地时间4月30日,2025年“汉语桥”中文比赛哥伦比亚赛区决赛在哥首都波哥大落幕。来自哥伦比亚大中小学的27名学生在两天的决赛中展现了自己的中文水平和对中国文化的了解。比赛设置了主题演讲和才艺展示两个环节。大学生比赛中还增设了中文知识问答环节。选手们在演讲中介绍了自己学习中文的感受以及对中国文化的
  • 经济大省挑大梁|大河奔流勇争先——河南奋力谱写中国式现代化出彩篇章
    嵩岳巍巍,芳原绿野;大河之南,势如春潮。2024年,河南省地区生产总值达6.36万亿元,增长5.1%。今年一季度增长5.9%,稳中向好再提速,顺利实现“开门红”。今年全国两会上,习近平总书记强调,圆满实现“十四五”发展目标,经济大省要挑大梁。粮食总产连续8年稳定在1300亿斤以上,“海陆空数”四条丝
  • “单医支村” 守护群众健康
    【来源:菏泽日报】中国菏泽网消息(记者 王富刚 通讯员 刘朝晖) 近日,单县中心医院总医院启动“单医支村”志愿服务活动,通过县、乡、村三级医疗联动,实现“群众健康有人问、住院有人管、出院有人访”,切实提升群众获得感、幸福感和安全感。“目前村里常住人口多少?糖尿病、高血压等慢病患者人数多少?肿瘤患者多
您的位置: 首页 > 实时讯息 >

刚刚,OpenAI最强图像生成API上线,一张图1毛5

0次浏览     发布时间:2025-04-24 12:16:00    

GPT-4o之后,OpenAI原生多模态图像生成模型API正式推出了,一张图低至0.02美元。新模型能够结合世界知识,生成更加符合上下文图像,质量更高,还支持多种功能自定义。

昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。

这一次,他们直接把每张图的成本打到几美分。

对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。

gpt-image-1集成了三大核心功能:图像生成、图像编辑、图像变体(仅限DALL·E 2)。

与GPT-4o图像生成不同,gpt-image-1最大的特点,在于支持各种高级功能的定制。

比如,自定义输出图像的质量、尺寸、格式、压缩程度,甚至可选择是否需要透明背景,能够满足多样化创意需求。

它具备了强大的通用能力,不仅能够创作多种风格图片,还能精准遵循自定义需求。通过结合世界知识,生成更符合上下文的图像。

现在,你就可以在playground中使用gpt-image-1来快速迭代提示词和图像:

GPT-4o上线掀起全网吉卜力风潮,并在发布首周全球1.3亿用户,创作了超7亿图片。

gpt-image-1作为OpenAI全新一个原生多模态图像模型,随着API开放,将会在未来极大地释放人们创意。

效果一览

在官方API文档「探索」区,OpenAI放出了许多gpt-image-1生成图片的demo,效果非常惊艳。

接下来,就一睹为快吧。

一句话,让gpt-image-1展示出创建鳄梨酱所需的所有食材。

下面这张梦幻之境,可是用了一个「小作文」提示词才完成的。

再来看它创作的外星人Glorptak,有着凝胶状身体,半透明发光,非常可爱。

对于模特、电商行业来说,gpt-image-1将重塑创作方式。上传一张衣服图、一张人的照片,就能看到衣服上身的效果了。

橄榄油宣传图,也只需找一张背景图,gpt-image-1瞬间完成P图。

更神奇的是,上传一张房屋设计平面图,gpt-image-1就能将其变为3D效果,更加直观。

番茄酱广告,非常有视觉冲击力。

设计矿泉水的瓶身,也是多种风格拿捏。

生成超写实的3D图标,看着非常有质感。

gpt-image-1还能生成粗线条手绘风格图解,为回针缝制法每一步配上了简洁的说明文字。

上传一张CD模板图,让gpt-image-1生成金属乐队黑胶唱片。

还有各种纹理的防止图案,也是非常有创意。

还有动画分镜脚本——马匹跳跃循环序列,gpt-image-1可做到逐帧解剖要点。

上传独立流行音乐人的照片,一张演唱会门票直接设计好了。

自定义图像输出,精准创意

目前,OpenAI GPT Image API提供了丰富的自定义选项,让开发者完全掌控输出效果。

尺寸:支持多种分辨率,比如1024x1024, 1024x1536

质量:可选low,medium,high三种渲染质量

格式:文件输出格式

压缩:针对JPEG和WebP格式,可设置0-100%级别的压缩

背景:透明或不透明

生成图像

通过图像生成端点,仅凭一段文本提示,即可生成令人惊叹的图像。

可设置参数n ,一次可生成多张图像(默认情况下,API返回单张图片)。

图像编辑

而图像编辑功能,可以让创意更进一步。通过图像编辑端点,你可以:

  • 直接编辑现有图片
  • 参考图像生成新图片:上传多张参考图像,然后生成新图
  • 局部编辑(inpainting):通过上传图像和蒙版,精准替换指定的区域

参考图像生成新图片

比如,上传四张礼品图片,生成一个包含所有礼品的精美礼物篮的图像。

使用蒙版编辑图像(局部编辑)

你可以上传一个蒙版来编辑图像,蒙版中的透明区域将被替换,而黑色区域保持不变。

OpenAI建议,你可以使用提示来描述整个新图像,而不仅仅是被擦除的区域。

蒙版要求:

1. 图像和蒙版需要格式一致,尺寸相同,大小不超过25MB。

2. 蒙版需包含Alpha通道,在图像编辑工具中保存蒙版时,务必勾选「保存Alpha通道」。

在自定义中,还需要注意的包括:

方形图片以标准质量生成的速度最快,默认大小是1024x1024。

Image API返回base64编码的图像数据,默认格式是png ,但你也可以请求jpeg或webp。

如果使用jpeg或webp,还可以指定output_compression参数来控制压缩级别(0-100%)。例如, output_compression=50就是把图像压缩50%。

此外,gpt-image-1支持透明背景。要启用透明度,需将background参数设置为transparent。

模型对比

虽然gpt-image-1是目前OpenAI最强大的多模态模型,此前推出的DALL·E 2和DALL·E 3则是专为图像生成设计的模型,各有所长。

根据不同需求和场景,开发者可灵活从中选用这些模型API。

gpt-image-1使用同样是按Token计费,文本和图像的Token各有不同的价格:

  • 文本输入Token:5美元/百万token
  • 图像输入Token:10美元/百万token
  • 图像输出Token:40美元/百万token

如前所述,在实际应用中,对于低、中和高质量的方形图片,每生成一张图像的费用大约分别为0.02美元、0.07美元和0.19美元。

从创意到商业无限可能

OpenAI全新Image API的推出,将为各行各业解锁更多创意魔法。

目前,创意工具、电商、教育、企业软件、游戏等行业的领先企业和初创公司,已经将图像生成集成到他们的产品和服务中。

Adobe的创意工具,包括Firefly和Express,将通过gpt-image-1为创作者提供选择和灵活性,方便他们实验不同的美学风格。

Figma正在利用gpt-image-1从简单的提示词生成和编辑图像,使设计师能够快速探索创意并直接在Figma中进行视觉迭代。

HeyGen正在使用gpt-image-1来增强头像创建,特别是在平台内改善头像编辑。

Photoroom正在使用gpt-image-1帮助在线卖家从单一产品照片中瞬间创建工作室级别的视觉效果、生活场景和模特展示图。

此外,Canva已将gpt-image-1集成到Canva AI和Magic Studio工具中,进一步扩展设计生成和编辑能力。

简单的草图,gpt-image-1即可将其转化为精美图形元素。与此同时,它还支持高保真的视觉编辑,让2.3亿用户能够用全新方式将创意变为现实。

专为设计logo而生的GoDaddy,通过集成gpt-image-1,可以轻松创建编辑Logo,去除背景并生成专业字体设计。

借助GoDaddy Airo,创意者通过提示即可生成原创产品和品牌内容,并打造体现自身品牌个性的社交媒体和营销素材。

还有HubSpot通过OpenAI图像新模型,有望彻底革新客户制作高质量社交媒体、邮件营销以及落地页图片的方式,无需专业设计经验也能轻松实现。

Instacart正在测试如何利用API生成用于菜谱和购物清单的图片,以提升用户体验。

创作个性化视频invideo,在集成gpt-image-1后,将支持更强大的文本生成、精细化编辑控制和高级风格指导,进一步丰富了用户的视频创作体验。

参考资料:

https://openai.com/index/image-generation-api/

本文来自微信公众号“新智元”,作者:桃子 好困,36氪经授权发布。

相关文章
  • 时政Vlog|在上海,感受AI发展的澎湃脉动
    发布日期: 2025-05-01 01:42:00
    4月29日,习近平总书记来到上海“模速空间”大模型创新生态社区调研,通过视频短片了解上海市人工智能产业发展情况,察看重点孵化企业的大模型产品展示,听取相关技术研发和企业生产经营介绍。总书记对上海积极发展人工智能取得的实效给予肯定。他指出,人工智能技术加速迭代,正迎来爆发式发展,上海要总结好以大模型产
  • 沿着海岸看中国丨河北唐山:共享“梦工厂”开启机器人“智”变引擎
    发布日期: 2025-04-28 01:24:00
    共享充电宝、共享单车,想必大家早已熟悉,那共享工厂,您了解多少呢?在河北省唐山市高新区,有一座全国首家机器人非标产品定制共享工厂,由唐山百川集团精心打造。这里可是京津冀人工智能与机器人领域的产业共享服务核心平台。在这里有句响亮的口号:“一件也接单,有创意你就来!”因此也吸引了无数创业者。共享工厂构建
  • 福建:AI潮涌 数字规模突破 3.2 万亿元
    发布日期: 2025-04-27 10:23:00
    【福建在 AI 浪潮中数字产业蓬勃发展】在 AI 浪潮下,美图旗下的“美图设计室”可一键生成电商新品相关。美图自研的视觉大模型“奇想智能”是福建首款通过国家网信办备案的大模型,加速拓展了 AI 图像等应用场景。国投智能推出公共安全领域大模型“天擎”,众数(厦门)推出船舶与海洋工程行业大模型“文鳐”等
  • 德州仪器:如有需要,可依赖位于中国的制造工厂
    发布日期: 2025-04-24 13:01:00
    当地时间4月23日,德州仪器在财报中透露了对于美国半导体关税的看法。该公司是首家公布财报的美国大型半导体厂商。德州仪器今年股价累计下跌超过17%。德州仪器第一季度营收40.7亿美元,同比增长约11%,净利润11.8亿美元,同比增长约6.7%,每股收益为1.28美元。美国关税威胁加剧了整个半导体行业的
  • 刚刚,OpenAI最强图像生成API上线,一张图1毛5
    发布日期: 2025-04-24 12:16:00
    GPT-4o之后,OpenAI原生多模态图像生成模型API正式推出了,一张图低至0.02美元。新模型能够结合世界知识,生成更加符合上下文图像,质量更高,还支持多种功能自定义。昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。这一次,他们直接把每张图的成本打到几美