你的位置:パナソニック 分電盤 リミッタースペースなし 露出・半埋込両用形 > 五月色 >

白虎 女 “探求机视觉被GPT-4o闭幕了”(狗头)

  • 发布日期:2025-03-30 12:02    点击次数:81
  • 白虎 女 “探求机视觉被GPT-4o闭幕了”(狗头)

    整夜之间白虎 女,CV 被大模子"科罚"了(狗头)。

    万物皆可吉卜力之后,GPT-4o 原生多模态图像生成更多玩法被成立出来。

    一个男友回头色调包,不错秒变语义分割图。

    也不错秒变深度图。

    这下不光上一代 AI 绘制用具和想象师,探求机视觉盘考员也哭晕在茅厕了。

    这是 NASA 前工程师测试特斯拉自动驾驶系统的伪装"隐形墙",在 GPT-4o 眼前也无所遁形。

    这下 OpenAI 诈欺盘考左右 Boris Power 照旧把脑筋动到了自动驾驶,称只需要考试最高大的基础模子,然后微调。

    3D 渲染范围也惨遭辣手,GPT-4o 不错生成 PBR 材质(基于物理渲染的材质),纹理、法线贴图等径直来一套。

    关于这些才气,也有东说念主以为没什么大不了的,色色网Stable Diffusion + ControlNet 就不错全部结束。

    但不能否定,靠扩大基础模子范围就能作念到,亦然令东说念主出东说念主料思的。

    这波 GPT-4o 原生图像生成的本事细节,OpenAI 是少许也莫得公布(粗节也莫得公布)。

    但如故有东说念主从 System Card 中发现了蛛丝马迹。

    与 DALL · E 是一个扩散模子不同,GPT-4o 图像生成是原生镶嵌在 ChatGPT 内的自追想模子。

    空姐 偷拍

    还有东说念主不雅察图像的生成经过,发现很可能是多圭臬自追想的组合,先生成一个顽劣的图像,填充细节的同期,顽劣图形本人也在变化。

    自追想模子字据之前的像素或 patch 展望下一个像素或 patch,获取更好地盲从教导,以及图像剪辑的才气。

    但也有东说念主援用发 OpenAI 职工 Allan Jabri 晒出的板书图,建议在解码阶段仍然有可能用了扩散模子。

    针对这一猜思,更具体的结束规范不错参考 Meta 等 24 年 8 月的一篇论文:使用一个多模态模子同期展望展望下一个 token 和扩散图像。

    终末,微信挑剔区能发图片了,宽宥大家把更多 GPT-4o 好奇钦慕玩法晒出来~

    GPT-4o Native Image Generation System Card

    https://cdn.openai.com/11998be9-5319-4302-bfbf-1167e093f1fb/Native_Image_Generation_System_Card.pdf

    Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

    https://arxiv.org/abs/2408.11039v1

    参考贯穿:

    [ 1 ] https://x.com/fofrAI/status/1905289275316326679

    [ 2 ] https://x.com/a_karvonen/status/1905372299814932963

    一键三连「点赞」「转发」「留神心」

    宽宥在挑剔区留住你的思法!

    —  完  —

    速抢席位!中国 AIGC 产业峰会不雅众报名通说念已开启  � � ‍♀️

    首批嘉宾曝光啦  � �   百度、无问芯穹、数势科技、生数科技、像素开放等十数位 AI 范围创变者将皆聚峰会,让更多东说念主用上 AI、用好 AI,与 AI 一同加快成长~

    4 月 16 日,就在北京,扫数来深度求索 AI 怎样用  � �  

    � � 一键星标 � �

    科技前沿线路逐日见白虎 女