【新智元导读】备受期待的阶跃星辰图像天生大模型Step-1X,正式上线了!
创作古诗词配图意境绝美,古典中国园林的每片叶子都很逼真,巴黎街道堪比单反。而且,这次官方还表露了两个隐蔽玩法,让生图效果噌噌up。
近日,大模型创业公司阶跃星辰在其开放平台体验中央,正式上线了图像天生大模型Step-1X,注册即可体验。
指路链接:https://platform.stepfun.com/console-tools?model=step-1x-medium
事实上,这款大模型之前已经备受期待。
在7月份举行的2024天下人工智能大会上,阶跃星辰一口气发布了万亿参数措辞大模型Step-2、多模态大模型Step-1.5V和图像天生大模型Step-1X三款大模型,并且跟上海电影梦幻联动,基于经典IP《大闹天宫》开拓了H5互动体验「测测你是哪路神仙」。
据理解,《大闹天宫》可用于演习的数据资源稀缺,但Step-1X图像天生大模型只用了极其少量的数据,就实现了质量可不雅观的天生效果。
我们此前测试的结果是ISFP,被诊断为蟠桃仙官
Step-1X重点打磨了深度语义对齐能力和细节天生能力,采取全链路自研的DiT(Diffusion Models with transformer)模型架构,能深度理解繁芜指令下的含义,比如多主体和繁芜场景背后的逻辑关系、情绪和文化内涵。
Step-1X还支持高达2000个字符的图片天生指令,能让图文精准匹配,灵巧知足广告创意、游戏美术、影视制作、产品设计、教诲赞助平分歧场景下的创作需求。
其余,Step-1X针对中国元素和文化进行了深度优化,在处理中国风内容时具有独特上风,能更好地演绎出背后的文化精髓。
Step-1X发布后,不少用户已经率先玩起了创意,从大家的体验图中我们也不雅观察到了这款大模型在不同创作场景下的天生效果:
诗画创作
让大模型为古诗词配图,寻衅在于是否能精准理解古诗中描述的象征性事物,并捕捉和抒发出诗词背后的意境和墨客蕴含个中的情绪。
「疏影横斜水清浅,暗香浮动月薄暮」,图片描述出了梅花照水,在月光下暗香浮动的唯美和安谧。
「采菊东篱下,悠然见南山」,有纵深感的绘画视角与「远远看到南山」的含义相应和,明朗柔和的用色表示出了陶渊明诗词背后豁达开阔的心境。
「随处为家白发新,浮云一片是吾身」,Step-1X用国风动漫风进行了刻画,设计了一个背对画面的人物,站在高处远眺壮阔的云海,去表到达处为家的随意率性洒脱。
故事绘本
越来越多作家开始用AI写小说、配插图,也有用户通过给Step-1X描述剧情,创作属于自己的故事绘本。比如:
故事:女孩的神秘探险1. 一个未来的水下城市中,女孩戴着透明头罩,穿梭在闪烁着蓝绿色光芒的隧道里。她周围是高耸的珊瑚建筑和游弋的海洋生物。头罩内的智能系统实时剖析环境,她的任务是探索这片充满未知的海底天下以及体验深海带来的神秘与孤独感。
2. 一个未来的水下城市中,女孩戴着透明头罩,穿着黑蓝色的高科技质感的潜水服,她四肢细长,在海里像一个幽美的美人鱼。她创造海底天下边缘某处闪着刺目耀眼的金光,彷佛是一处宝藏,她向宝藏的方向游去。远景镜头。
3. 一个未来的水下城市中,在水下城市的最深处,俏丽的女孩戴着透明头罩,穿着黑蓝色的高科技质感的潜水服,她创造了海底的宝藏,宝藏放在一个破旧的箱子里金光闪闪,宝藏后面隐蔽着一只凶猛的巨兽。
古风人物
Step-1X在天生古代人物时,对富有历史感的衣饰表示出了像素极的把握,比如在这幅凤冠霞帔的女子画面中,饰品上的纹路都清晰可见。
当代人物
用Step-1X天生当代人物的视觉图像,对女孩子发丝、雀斑、唇纹的描述细致入微,且图像就定格在水点滑落的瞬间,有了韶光感。
动画英雄
用Step-1X天生动画英雄人物的形象,Step-1X 交的答卷展现出了几种对英雄的刻画办法:刺目耀眼的、眼神坚毅的、在冲突性场景中对抗对手的。
旁边滑动查看
艺术画作
Step-1X可以为用户指定的创作元素授予不同艺术流派的风格,这背后是文生图大模型对艺术家风格的捕捉和理解能力。
比如模拟印象派大师莫奈创作的花海,捉住了光影轮廓线模糊化、色彩透明度高的特点,演绎出印象派抒怀的画风。
而模拟达利创作的图片,捕捉了超现实主义荒诞不羁的特色,呈现了一个内容魔幻的动物茶话会。
生动有趣的动物刻画
在对动物形象的描述中,Step-1X呈现出了细腻的画风,而且动物在刻画中被授予了或可爱或威武的人格。
隐蔽玩法
阶跃星辰官方"大众号还表露了两个隐蔽玩法,能让生图效果得到加成:
1. 在Prompt中融入咒语「令人叹为不雅观止的细节,逼真的画面」,让图片的写实程度进一步提升。
图片中对古典中国园林的刻画极致入微,能细致到每片叶子,巴黎街道的长曝光图片也跟单反相机拍摄效果有的一拼。
古典中国园林景象
巴黎街道的长曝光照片
2. 用智能助手「跃问」完善Prompt
阶跃星辰开拓的智能助手「跃问」搭载了Step-1.5V多模态大模型,识图能力Max。
把图片发给跃问(yuewen.cn),配高下面这段Prompt后,利用新得到的Prompt进行文生图创作:「你是一个文生图模型的提示词专家,你长于通过图片剖析内容里面的人物形象、环境、背景、图片风格、色调等信息,然后以此为根本创作文生图模型的提示词。」
比如下面两张图,基于跃问识图和Step-1X文生图能力,天生了一张与原图中人物动作、情绪都十分类似的图片。
原图
Step-1X天生图
其余,除了上线图像天生大模型Step-1X ,阶跃星辰开拓平台近期还迎来了多项更新,包括:
发布极速版模型Step-1-flash。Step-1-flash是一款高性价比模型,可支持的高下文长度为8k,相对付此前发布的Step-1措辞大模型首字延迟降落25%,输出速率是Step-1的1.7倍。开放平台体验中央上线,体验中央具有直不雅观的用户界面,无需编写任何代码即可体验阶跃星辰旗舰模型。上线了运用开拓指南,根据开拓者碰到的高频问题,供应大模型运用开拓的最佳实践辅导和代码示例。目前已经上线了关于文生图、 Json Mode、Prompt Engineering、流式输出、多轮对话、非常处理和Tool Call的内容。要迎来AI运用的井喷式爆发,先决条件是底层大模型创新公司能坚持探索技能边界,通过生态开放实现技能普惠,无限降落开拓者的利用门槛。
阶跃星辰正在这条路上持续加码,除了快速迭代模型产品,阶跃星辰也面向AI运用开拓者推出了「繁星操持」,供应免费tokens、技能支持、孵化器做事、行业资源对接等一系列支持和做事。