今年上半年的AI产品出奇的多文本、视频、图片全面开花不少人说Images 2.0图片生成效果足以让平面设计师、漫画师失业了。这几天在ChatGPT上测试了Images 2.0不需要买啥会员免费版每天都有几张生成额度。我找了几个场景用它生成“中国朝代表介绍图”、“奔驰大G零部件拆解图”、“杂志封面-故宫建筑艺术”。效果出乎意料的好是那种一键出片、无需修饰的好。实话实说Images 2.0强在你一眼看上去它生成的图片不像是AI做的而是某个设计师、漫画家熬了几个通宵搞出来的东西。之前的Nano banana也让我惊喜特别是生成手办的真实度但Images 2.0又向前走了一大截突破了绘图AI的瓶颈主要是以下三个点。1、AI绘图第一次有了思考的能力先想再画Images 2.0在收到指令绘图前会搜索网络资源并进行逻辑推演画好后自我检查纠正保证了丰富度和准确性。2、图像文本渲染精确度达到新高完美支持中文之前想要生成一张图文并茂的图像尤其是中文等非拉丁字符会出现乱码、无序、错别字等各种问题更不要提排版了。但这次Images 2.0解决了这个问题生成的图文效果不比10年经验的美工设计师差。3、第一次实现规模化输出且具备复杂系统可视化能力用AI生成几百页的精美漫画在Images 2.0上成了现实或者生成十几张房屋装修设计图彼此关联且风格一致。其次Images 2.0由于具备信息采集和推理能力可以实现复杂系统的信息图展示比如拆解一辆奔驰大G的零部件。除此之外Images 2.0图像精美度和真实感也更高这个对比起来可能没那么突出因为现在其他商业AI绘图应用也做的很好。Sam Altman在Images 2.0的发布视频特意强调说Images 2.0是图像生成的文艺复兴智能化程度直接从gpt3跨越到gpt5具备了生产级的效果。从我的实测体验来看他说的话没错。有意思的是这次发布会除了奥特曼之外核心开发团队的四个人都是华人我查了基本是在国内求学从清北出去的CS背景不得不感慨华人在AI技术领域强到可怕。
Image 2.0,这效果有点炸裂
今年上半年的AI产品出奇的多文本、视频、图片全面开花不少人说Images 2.0图片生成效果足以让平面设计师、漫画师失业了。这几天在ChatGPT上测试了Images 2.0不需要买啥会员免费版每天都有几张生成额度。我找了几个场景用它生成“中国朝代表介绍图”、“奔驰大G零部件拆解图”、“杂志封面-故宫建筑艺术”。效果出乎意料的好是那种一键出片、无需修饰的好。实话实说Images 2.0强在你一眼看上去它生成的图片不像是AI做的而是某个设计师、漫画家熬了几个通宵搞出来的东西。之前的Nano banana也让我惊喜特别是生成手办的真实度但Images 2.0又向前走了一大截突破了绘图AI的瓶颈主要是以下三个点。1、AI绘图第一次有了思考的能力先想再画Images 2.0在收到指令绘图前会搜索网络资源并进行逻辑推演画好后自我检查纠正保证了丰富度和准确性。2、图像文本渲染精确度达到新高完美支持中文之前想要生成一张图文并茂的图像尤其是中文等非拉丁字符会出现乱码、无序、错别字等各种问题更不要提排版了。但这次Images 2.0解决了这个问题生成的图文效果不比10年经验的美工设计师差。3、第一次实现规模化输出且具备复杂系统可视化能力用AI生成几百页的精美漫画在Images 2.0上成了现实或者生成十几张房屋装修设计图彼此关联且风格一致。其次Images 2.0由于具备信息采集和推理能力可以实现复杂系统的信息图展示比如拆解一辆奔驰大G的零部件。除此之外Images 2.0图像精美度和真实感也更高这个对比起来可能没那么突出因为现在其他商业AI绘图应用也做的很好。Sam Altman在Images 2.0的发布视频特意强调说Images 2.0是图像生成的文艺复兴智能化程度直接从gpt3跨越到gpt5具备了生产级的效果。从我的实测体验来看他说的话没错。有意思的是这次发布会除了奥特曼之外核心开发团队的四个人都是华人我查了基本是在国内求学从清北出去的CS背景不得不感慨华人在AI技术领域强到可怕。