单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率

单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率

单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率
乘法和排序也有效。...
2024-06-03 · 浏览506次
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积

Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积

Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
用卷积能做出一样好的效果。...
2024-06-03 · 浏览515次
ASQuery:基于Query的时序动作分割新架构

ASQuery:基于Query的时序动作分割新架构

ASQuery:基于Query的时序动作分割新架构
北京邮电大学与EVOL创新团队和ACG工业算法组针对时序动作分割任务共同提出了基于query新架构的模型ASQuery。...
2024-06-03 · 浏览615次
CVPR 2024 | 自动驾驶世界模型四维时空预训练

CVPR 2024 | 自动驾驶世界模型四维时空预训练

CVPR 2024 | 自动驾驶世界模型四维时空预训练
北京大学与EVLO创新团队共同提出面向自动驾驶的四维时空预训练算法DriveWorld。...
2024-06-03 · 浏览582次
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜

ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜

ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章,核心观点是 —— 虽然很多 LLM 看起来有记忆,但本质上是无状态函数。...
2024-06-02 · 浏览1283次
“乐坛 ChatGPT”Suno 发布 V3.5 模型,所有人可免费制作 4 分钟歌曲

“乐坛 ChatGPT”Suno 发布 V3.5 模型,所有人可免费制作 4 分钟歌曲

“乐坛 ChatGPT”Suno 发布 V3.5 模型,所有人可免费制作 4 分钟歌曲
此前引起IT之家网友热议的“乐坛ChatGPT”Suno日前发布了V3.5版本,并宣布已经向所有用户开放。...
2024-06-02 · 浏览696次
生成式 AI 技术大爆发,2026 年中国人形机器人产业规模或破 200 亿元

生成式 AI 技术大爆发,2026 年中国人形机器人产业规模或破 200 亿元

生成式 AI 技术大爆发,2026 年中国人形机器人产业规模或破 200 亿元
据央视财经报道,预计到 2026 年,中国人形机器人产业规模将突破 200 亿元。在生成式人工智能技术大爆发的当下,未来人形机器人更是极有可能实现超预期增长。...
2024-06-02 · 浏览495次
阿里蔡崇信:AI 模型训练过程像教育孩子,某些方面学习三四年可达博士水平

阿里蔡崇信:AI 模型训练过程像教育孩子,某些方面学习三四年可达博士水平

阿里蔡崇信:AI 模型训练过程像教育孩子,某些方面学习三四年可达博士水平
蔡崇信认为,人们竞相展示各自的大语言模型时,就相当于在说“我有一个孩子,他拥有三个博士学位,精通生物学、数学、心理学等多个领域。”...
2024-06-02 · 浏览444次
消息称阿尔特曼计划将 OpenAI 重组为营利性公司,旨在为投资者提供激励

消息称阿尔特曼计划将 OpenAI 重组为营利性公司,旨在为投资者提供激励

消息称阿尔特曼计划将 OpenAI 重组为营利性公司,旨在为投资者提供激励
据The Information今日报道,知情人士称OpenAI CEO山姆·阿尔特曼正考虑将OpenAI重组为一家正规的营利性公司,重点解决公司性质(IT之家注:非营利公司)...
2024-06-01 · 浏览465次
OpenAI 重启机器人团队,联合多方回归老赛道

OpenAI 重启机器人团队,联合多方回归老赛道

OpenAI 重启机器人团队,联合多方回归老赛道
OpenAI 成立初期,机器人技术就是其主攻方向之一,联合创始人沃伊切赫・扎伦巴领导的团队最初试图打造一个“通用机器人”。...
2024-06-01 · 浏览387次
2D头像生成3D虚拟人开视频会,谷歌新作让人难绷

2D头像生成3D虚拟人开视频会,谷歌新作让人难绷

2D头像生成3D虚拟人开视频会,谷歌新作让人难绷
未来人与人的交流,难道是这个样?...
2024-06-01 · 浏览362次
爆火ChatTTS突破开源语音天花板,3天斩获9k的Star量

爆火ChatTTS突破开源语音天花板,3天斩获9k的Star量

爆火ChatTTS突破开源语音天花板,3天斩获9k的Star量
未来人与人的交流,难道是这个样?...
2024-06-01 · 浏览804次
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进

解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进

解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。...
2024-06-01 · 浏览489次
最强开源编程大模型一夜易主:Codestral 精通 80 + 语言,参数量仅 22B

最强开源编程大模型一夜易主:Codestral 精通 80 + 语言,参数量仅 22B

最强开源编程大模型一夜易主:Codestral 精通 80 + 语言,参数量仅 22B
开源代码大模型的王座,再次易主!来自素有“欧洲 OpenAI”之称的 Mistral,用 22B 参数量表现超越了 70B 的 Code Llama。...
2024-05-31 · 浏览1128次
谷歌将在马来西亚投资 20 亿美元:建数据中心 / 进一步开发 AI,拟创造 2.65 万个就业岗位

谷歌将在马来西亚投资 20 亿美元:建数据中心 / 进一步开发 AI,拟创造 2.65 万个就业岗位

谷歌将在马来西亚投资 20 亿美元:建数据中心 / 进一步开发 AI,拟创造 2.65 万个就业岗位
谷歌今日通过声明宣布,承诺在马来西亚投资20亿美元(IT之家备注:当前约 145.2 亿元人民币),投资项目包括建设首座数据中心、新的谷歌云区域以及进一步开发人工智能。...
2024-05-31 · 浏览546次
苹果 iOS 18 AI 功能更多细节曝光:Siri 更智能、可解答数学题

苹果 iOS 18 AI 功能更多细节曝光:Siri 更智能、可解答数学题

苹果 iOS 18 AI 功能更多细节曝光:Siri 更智能、可解答数学题
苹果计划在即将发布的 iOS 18 中引入多项由人工智能驱动的功能,其中包括消息智能回复和照片生成式修图工具。来自 AppleInsider 的最新报道透露了 iOS 18 一...
2024-05-31 · 浏览523次
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型

速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型

速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
开放但禁止商用用途。...
2024-05-31 · 浏览471次
大模型进入「实用」时代,亚马逊云科技已是Next Level

大模型进入「实用」时代,亚马逊云科技已是Next Level

大模型进入「实用」时代,亚马逊云科技已是Next Level
在云计算领域竞争最激烈的时代,亚马逊云科技曾提出,云计算的普惠是技术升级带来的。...
2024-05-31 · 浏览387次
效果超AlphaFold系列,量子计算方法用于蛋白质结构预测

效果超AlphaFold系列,量子计算方法用于蛋白质结构预测

效果超AlphaFold系列,量子计算方法用于蛋白质结构预测
随着量子计算的快速发展,人们自然会问:量子计算机是否能为解决这一问题提供一些帮助。然而,确定适合量子优势的特定问题实例,以及评估所需的量子资源同样具有挑战性。...
2024-05-31 · 浏览461次
欧盟宣布成立人工智能办公室,对 AI 进行监管

欧盟宣布成立人工智能办公室,对 AI 进行监管

欧盟宣布成立人工智能办公室,对 AI 进行监管
该办公室由包括技术专家、律师和经济学家在内的 140 名成员组成,设有首席科学顾问和国际事务顾问。...
2024-05-30 · 浏览486次
哥大和耶鲁团队开发新算法,阐明结肠癌耐药机制

哥大和耶鲁团队开发新算法,阐明结肠癌耐药机制

哥大和耶鲁团队开发新算法,阐明结肠癌耐药机制
利用蛋白质组学技术和神经网络,哥伦比亚大学和耶鲁大学的研究团队引入了 VESPA(Virtual Enrichment-based Signaling Protein-acti...
2024-05-30 · 浏览482次
奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了

奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了

奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
OpenAI 开始训练下一个前沿模型了。...
2024-05-30 · 浏览401次
快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起

快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起

快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起
自 2023 年 AI 技术爆发以来,以 ChatGPT、Stable Diffusion 为代表的大模型已然成为了大众的焦点,其中 Stable Diffusion 作为知名...
2024-05-30 · 浏览536次
填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来

填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来

填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
世界是变化的,分子是运动的,从预测静态单一结构走向动态构象分布是揭示蛋白质等生物分子功能的重要一步。...
2024-05-30 · 浏览888次
第一页 · 上一页 · 下一页 · 当前第308页