文本生成 标签,匹配到约90个结果, 耗时0.0374秒

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。...
2025-04-26
·
浏览55次

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。...
2025-04-23
·
浏览62次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。...
2025-04-19
·
浏览54次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney...
2025-04-19
·
浏览63次

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗...
2025-04-18
·
浏览75次


无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11
·
浏览55次


7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05
·
浏览76次


仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

该框架包含三个连续步骤:对齐两种模态表征的 ProteinCLAP、从文本模态生成蛋白质表征的 Facilitator,以及根据表征生成蛋白质序列的解码器。...
2025-04-04
·
浏览73次


上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26
·
浏览124次

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻...
2025-03-26
·
浏览96次

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。...
2025-03-26
·
浏览90次


单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18
·
浏览106次






DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览126次

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。...
2025-03-04
·
浏览89次