文本生成 标签,匹配到约90个结果, 耗时0.0374秒
Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像
Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。...
2025-04-26 · 浏览55次
Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话
Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。...
2025-04-23 · 浏览62次
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒
字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。...
2025-04-19 · 浏览54次
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒
字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney...
2025-04-19 · 浏览63次
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗...
2025-04-18 · 浏览75次
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理...
2025-04-15 · 浏览55次
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11 · 浏览55次
三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭
三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭...
2025-04-08 · 浏览50次
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05 · 浏览76次
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
文生图 or 图生文?不必纠结了!...
2025-04-05 · 浏览114次
仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架
该框架包含三个连续步骤:对齐两种模态表征的 ProteinCLAP、从文本模态生成蛋白质表征的 Facilitator,以及根据表征生成蛋白质序列的解码器。...
2025-04-04 · 浏览73次
自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%
在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。...
2025-04-03 · 浏览84次
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26 · 浏览124次
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻...
2025-03-26 · 浏览96次
Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。...
2025-03-26 · 浏览90次
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。...
2025-03-24 · 浏览88次
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18 · 浏览106次
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。...
2025-03-18 · 浏览283次
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人?...
2025-03-14 · 浏览112次
使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独
没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?...
2025-03-12 · 浏览134次
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现...
2025-03-11 · 浏览81次
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错...
2025-03-11 · 浏览91次
DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07 · 浏览126次
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。...
2025-03-04 · 浏览89次
第一页 · 上一页 · 下一页 · 当前第1页