米乐yy易游平台:
现已进化到如此传神的境地,但细心研讨之后发现原来是AI充当了“手办大师”。给AI模型一张有人物、宠物或许虚拟形象的图片,再辅以恰当提示词,它就能给你生成一张以假乱真的手办“相片”。
这类AI手办图的盛行,源于谷歌在8月末最新发布的Gemini 2.5 Flash Image模型(代号“Nano Banana/纳米香蕉”)。这个“香蕉”的运用操作非常流通,让不少网友奉其为“AI修图的神”。
合理我们在为又一个“ChatGPT时刻”喝彩时,“香蕉”的同赛道玩家现已极速上台。9月初,字节跳动Seedream 4.0、生数科技Vidu Q1的参阅生图相继问世。不到半个月的时刻,AI生图模型就杀出三员大将,几乎“卷疯了”。
9月12日,闻名评测组织Artificial Analysis发布音讯称,字节跳动Seedream 4.0已登顶文生图、图像编辑排行榜榜首,在上述两个范畴都逾越了谷歌的纳米香蕉。
那么,究竟哪家才是AI生图的真神?笔者运用相同的参阅图、提示词对上述3个模型做了简略的比照测验。
榜首题为根底题型,即最近盛行的AI手办图。主体是一只长毛小猫,提示词则参阅了大多数网友运用的版别,为了精确性,给纳米香蕉的提示词选用英文翻译版别。
提示词:制造图中小猫的1/7份额的商业化手办,写实风格,实在环境,手办放在电脑桌上,手办运用圆形通明亚克力底座,底座上无文字,电脑屏幕里的内容为该手办的Zbrush建模进程,电脑屏幕旁放着印有原画的BANDAI风格的塑料玩具包装盒,电脑桌上还有制造手办的东西,如画笔、颜料、小刀等。
从生成成果来看,或许由于纳米香蕉现已是AI手办的“熟练工”,它生成的手办小猫更靠近实在手办的质感,并且对手办盒子外形的了解也更为到位,整张图片的光线明暗处理妥当,实在性较强。与之比较,Seedream 4.0对手办盒子了解有误,榜初次生成的后边的手办盒子为人形玩偶而非小猫,调整提示词后呈现了小猫,但人形玩偶仍未消失。Vidu Q1根本未对小猫进行手办原料的调整,毛发质感与原始相片根本共同,最不像手办。
接下来测验的是AI模型“神笔马良”的功力,如何将修建的是非线稿变为实在作用图。
提示词:坚持修建和视角的共同性,将图片改为实在国际中的相片,环境时刻为黄昏,要有灯火,参加一些行人。
在这一轮比拼中,Seedream 4.0最善解人意,初次就生成了作用冷艳的制品图。纳米香蕉初次生成的图片与“实在国际”有不小的距离,再次提示后,纳米香蕉为自己的误解抱歉并生成了更具实在作用的图片。而Vidu Q1在二次提示后,依然坚持自己对“实在国际”的共同了解。
第三题是“惹是生非”的才能,也便是文生图片。但因Vidu Q1现在只支撑参阅生图,所以此轮比拼由其他两位选手参加。
提示词:制造一张一家人围坐在家里桌子旁喝丝瓜汤的图片,实在相片风格,人物有男女老少,我们表情各异。
在相同的提示词下,Seedream 4.0明显更喜爱丝瓜汤,对“表情各异”的了解为大快人心,而纳米香蕉则觉得小孩子或许并不是特别喜爱丝瓜汤,一起,纳米香蕉自觉添加了其他菜式,使得这更像一顿实在的家常午饭。有意思的是,在提示词为英文且并未清晰提示人物人种的情况下,纳米香蕉这款有着全球血缘的AI仍是让亚裔家庭喝上了丝瓜汤。
提示词:制造一幅图1人物骑着图2黄色电瓶车行进在图3街景里的图片,图片风格与图3街景图坚持共同。
从风格交融来说,Vidu Q1对人物的处理更好,但好像没有了解电动车的根底结构,Seedream 4.0很谨慎地给出了人物行进不同方向的图片,而外来的纳米香蕉明显没能精确了解较为根底的提示词,终究变成纸片人误闯三次元的作用。当然,三个AI都不行“遵法”,没有为人物佩带头盔。
根据上述生成成果,不难发现每个AI模型都有自己的优势和缺陷,纳米香蕉能做到极致实在,Seedream 4.0了解才能不错,Vidu Q1体现均衡。
不过,AI模型的终究生成作用与提示词严密相关,本次提示词大多描绘较为简略,因而AI了解有差错是很正常的现象。并且,AI生图的才能调查包含共同性、实在性、清晰度、语义了解、美学等多维度,各家AI在各方面体现必然有所差异。
但与前期的AI模型比较,上述三个AI模型在文生图、参阅生图、图像编辑等方面的才能已然有了腾跃式提高,完成了了解才能更强、出图时刻更快、画面更实在高清的打破。
电 话:0519-86255607
传 真:0519-86255607
网 址:www.zyouzb.com
地 址:常州市武进区武进东大道655号
Copyright © 2019 yy易游体育官网入口 - yy易游官网地址 - 米乐yy易游娱乐平台[官网] 苏ICP备12000277号 技术支持:yy易游体育官网入口 网站地图