恒峰娱乐G22 | 恒峰国际G22

恒峰娱乐G22在线登录_恒峰国际G22

当前位置:主页 > 新闻资讯 > 常见问题 >

这个 AI 生图神器太好玩了,连提示词都不用写

AI 生图东西,曾经多得众多了,但 Google 最新推出的 Whisk,仍是找到了一种很新的弄法,让见过世面的网友也直呼好玩。只要输入三张图片,subject(主题)、scene(场景)、style(作风),Whisk 就能够天生一张博采众长的图片。▲ 图片来自:Google举个例子,主题是白叟,场景是藤蔓,作风是 90 年月复旧动漫,写上「脚色骑着飞翔自行车」的提醒词,等候一会儿,一张相似吉卜力画风的新图片出生了。▲ 图片来自:Google白叟仍是谁人白叟,戴帽子,穿西装,拿着书,但他骑上了提醒词里的车,场景跟作风也都酿成了参考图片的样子。Whisk 的优点便在这里——让咱们少写、不写提醒词的同时,轻松玩转种种作风,妈妈再也不担忧我不会写提醒词了。别写庞杂的提醒词了,直接把图片端下去就行别看只要要多少张图片,Whisk 的弄法简略,却又无限无尽。刷刷刷上传三张图片——主题图片,麦当劳薯条;场景图片,莫奈画作《睡莲》;作风图片,像素风游戏《星露谷物语》。不写提醒词,直接天生,Whisk 给出的成果,一张更比三张强。除了上传本人的图片,咱们也能够掷骰子,让 Whisk 随机天生主题、场景、作风。实在,Whisk 为咱们供给的预设作风曾经很够用,徽章、贴纸、刺绣、黏土、美漫、马赛克拼贴等等,特点赫然,后果破竿见影。只有有脑洞跟设想力,无需一个字,仅仅经由过程差别图片的陈列组合,咱们能够一直地做完形填空的游戏——主题+场景+作风,并且不是每个空都必需填。▲ 1.主题图片,熏鸡;2.场景图片,梵高《星月夜》画作;3.作风图片,日本木版画▲ 1.主题图片,《戴珍珠耳饰的�女》;2.场景图片,片子《千与千寻》剧照;3.作风图片,蒙德里安形象画▲ 1.主题图片,微信「逝世亡笑容」心情包;2.场景图片,片子《星际穿梭》剧照;3.作风图片,史努比漫画截图▲ 1.主题图片,冲浪默许头像粉色恐龙 momo;2.作风图片,Jellycat 玩偶别的,Whisk 的每一次天生,场景跟作风只能抉择一个参考图片,但主题能够抉择多个。这象征着什么?咱们能够让多个脚色同框了!比方,让马斯克、奥特曼、扎克伯格通通酿成搪瓷徽章。三位的打扮、装潢、情态都复原得挺好,扎克伯格的发话器跟项链都没遗漏,但人脸没法坚持分歧性,全体酿成了民众脸。固然 Whisk 增加了写提醒词的需要,但你须要写的话,Whisk 也激励。在对话框加上一句「脚色们都举着一块通告牌,下面写着 AGI」,徽章君子们微微松松地遵守了提醒词。假如咱们须要某个场景或许某种作风,但一时找不到参考图,Whisk 的预设也不供给呢?处理方法很简略,不图片,那就写提醒词,让 Whisk 临场施展一个。就像我须要一个让脚色站上去的、像素作风的底座作为场景,就让 Whisk 帮我天生了。而后,再把猫猫心情包作为主题图片,把像素小鸡作为作风图片,就能够失掉一个有底座的像素猫猫。总之,Whisk 就长短常自在,像橡皮泥一样,怎样捏都能够。既生图又识图,把庞杂的任务流包装成风趣的「打蛋器」Whisk,实在是 Google 多模态模子秀肌肉的一种方法。为了让咱们少写提醒词,Whisk 整合了视觉懂得跟图片天生才能。Gemini 模子辨认图片,主动天生具体的描写,而后这些描写会被输入到 Google 的图片天生模子 Imagen 3,由 Imagen 3 生图。Whisk 是如许的,用户只有上传跟天生图片就能够了,但它本人要斟酌的事件就良多了。Whisk 的每张图片,不论是上传的仍是天生的,都写了很长的底层提醒词,而且不藏着掩着,咱们点开图片就能看,也能够上手修正。假如把一团体作为主题图片,Whisk 会具体地描写他的表面特点,场景图片也是相似的。▲ Whisk 对奥特曼的描写:「一个肤色较浅的女子,有着短而深棕色的卷发,从胸部以上展现。他有着淡色的眼睛。他衣着一件浅米色的针织圆领毛衣。配景是一面斑驳的灰色混凝土墙。女子的心情严正而中性。光芒有些阴暗,他的右脸有稍微的暗影。」作风图片略有些差别,假如把一张动画截图作为作风参考,Whisk 不会说,画面里有三团体,而是描写这幅画的颜色、光芒、线条……▲ Whisk 对史努比画风的描写:「这张图片以卡透风格浮现,存在粗暴的表面跟立体着色。颜色调色板无限,重要应用原色跟柔跟的主要色彩。光芒平均,缺少激烈的暗影或高光,给人一种简略、多少乎孩童般的质感。线条清楚且分歧,带有稍微不平均的质感,表示手绘的后果。团体美学让人遐想到经典的连环漫画或儿童动画。」以是,Whisk 不是精准地复制图片,而是提取图片的特色跟精华,将主题、场景、作风天然地融会在一同,各司其职,互不烦扰。同时,Whisk 也叠了甲——只从图片提取大批要害特点,成果可能跟预期差别。这也说明了,为什么 Whisk 做不到人脸的精准复原。以是,哪怕抉择不那么形象的复旧胶片作风,三位年夜佬的脸也是跟本尊都不挨着,但其余细节都很正确。物体也是一样,特斯拉的赛博皮卡,经由特点提取再天生之后,变得十分一般。但假如是麦当劳薯条这种素材丰盛的超等 IP,后果倒还不错,能够拿来当告白图了。试过一些迪士尼的脚色,Whisk 复刻得也原模原样,但图就不放下去了。别的,Whisk 还存在一个成绩——没法做很过细的作风参考,模拟不了某种特定的画风。当我让 Whisk 天生蒙娜丽莎的乐高君子,出来的成果让我两眼一黑,但多加一句提醒词,「让脚色更像乐高人物」,Whisk 又能模拟个七八成。某个漫画家的画风就更难模拟了,上传漫画截图让 Whisk 参考,它终极给出的是一个十分一般的漫画作风图片,就算经由过程提醒词夸大作品、脚色、漫画家,也不起什么感化。实在,Whisk 好玩就够了,它更合适做一些不寻求精准的创意摸索,俗称整活。Whisk 能够翻译为「搅拌」或许「打蛋器」,Google 的这个名字获得即视感很强,可不就是把食材都混搭在一同吗?Whisk 的不精准,也让它的定位跟传统的图片编纂器差别,更像是一种创意东西。有了什么脑洞,由它实现大略的视觉后果。▲ Whisk 天生,1.主题图片,《火影忍者》截图;2.作风图片,毛绒玩具从前实现 Whisk 这种作风化的后果,跑通一全部图像天生的流程,咱们可能须要在 ComfyUI 搭建任务流。但当初有了 Whisk,似乎就在玩抽卡游戏或许开盲盒,并且只有能登录(限美国地域),现在还收费。休会指路
Copyright © 2024-2026 恒峰娱乐G22在线登录_恒峰国际G22 版权所有

网站地图

备案号: