文本生成 标签,匹配到约102个结果, 耗时0.0432秒


科大讯飞董事长刘庆峰透露,7 月将升级讯飞星火 X1

今日举办的科大讯飞 26 周年会上,科大讯飞董事长刘庆峰在内部讲话中透露,讯飞星火 X1 升级版将于今年 7 月推出。...
2025-06-09
·
浏览56次


专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA...
2025-05-30
·
浏览120次

基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传

“写一篇 10,000 字的长文,详细分析某个议题。”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。...
2025-05-29
·
浏览104次

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了...
2025-05-29
·
浏览303次

谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间

谷歌推出开源框架LMEval,为大语言模型和多模态模型提供标准化评测工具。该框架支持文本、图像和代码等领域的基准测试,简化跨平台比较,还具备增量评估和可视化功能。#AI评测# #谷歌开源#...
2025-05-27
·
浏览85次

微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验

微软在Build 2025大会上宣布,Edge浏览器将支持设备端AI模型Phi-4-mini,开发者可通过新API将其集成到Web应用中,提供文本生成、总结等功能。目前已在Edge Canary和Dev频道开放试用。#微软Build2025...
2025-05-20
·
浏览81次

微软 Edge 浏览器被曝将集成 Phi-4 mini 模型,实现端侧 AI 功能

Phi-4 是一种小语言模型,其所需算力较低,运行效率更高,尤其适合推理类或较复杂的任务。据微软介绍,Phi-4 拥有约140亿个参数,在文本生成方面表现出色。...
2025-05-19
·
浏览78次


SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成

SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵...
2025-05-13
·
浏览103次

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08
·
浏览123次

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。...
2025-04-26
·
浏览156次

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。...
2025-04-23
·
浏览131次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。...
2025-04-19
·
浏览114次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney...
2025-04-19
·
浏览141次

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗...
2025-04-18
·
浏览185次


无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11
·
浏览129次


7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05
·
浏览149次


仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架

该框架包含三个连续步骤:对齐两种模态表征的 ProteinCLAP、从文本模态生成蛋白质表征的 Facilitator,以及根据表征生成蛋白质序列的解码器。...
2025-04-04
·
浏览133次
