AI 中文社区

软件工程传奇人物肯特 · 贝克：程序员若想在 AI 时代生存，还得学习人际交往能力

贝克指出，软件工程师即使技术能力出众，也常常缺少职场越来越重视的软技能。“我们未必擅长调节情绪，也不一定具有天然的同理心。我们说话往往太直接，超过了别人能够轻松接受的程度。”...

2026-07-03 · 浏览170次

数据推翻 AI 取代论：工程师岗位成科技行业抗风险最强工种

尽管 AI 常被视为裁员理由，但 SignalFire 报告显示，2025 年科技巨头新员工中工程师占比达 55%，远超 2019 年的 46%。工程岗招聘降幅远低于整体水平，初创企业需求更旺盛。效率提升并未减少工作，反而催生了更多新任务。...

2026-06-25 · 浏览168次

招商银行推出“运通工程师信用卡”，新用户办卡提供“专属 AI 权益”单月可享 18 亿 Token M3 用量

招商银行推出“运通工程师信用卡”，主打 AI 权益，新用户达标后可选择不同方案，最高每月获 18 亿 Token 用于多模态模型调用及 MaxClaw 部署。这标志着银行开始将 AI 算力作为信用卡增值服务。#信用卡 AI 权益#...

2026-06-16 · 浏览267次

龙虾 OpenClaw 工程师示警：AI 正批量制造低质量危险代码

华尔街日报昨日（5 月 22 日）发布博文，报道称参与打造“龙虾”OpenClaw 的 2 名工程师示警，AI 不只加快写代码速度，也可能把低质量代码批量扩散到真实产品与服务里。...

2026-05-23 · 浏览246次

研究显示：AI 智能体不会让软件工程师丢饭碗，反而拓展其工作边界

新研究提出“半可信执行栈”模型，指出 AI 智能体非但不会让软件工程师失业，反而将工程师的工作范围从经典代码扩展到社会制度适配等六个层面。目前 AI 的漏洞集中在决策与制度适配等宏观流程，人类的价值在于测试、监控与宏观把控。#AI 与就业#...

2026-04-26 · 浏览267次

创造“氛围编程”术语的 OpenAI 联合创始人卡帕西：下一个大趋势是“智能体工程”

OpenAI联合创始人安德烈・卡帕西提出“智能体工程”新概念，指AI智能体自主编写代码，区别于人类提示AI的“氛围编程”。相关领域融资火爆，如Lovable获33亿美元B轮融资。AI编码正冲击传统工程师岗位。 #AI编程革命# #智能体工程...

2026-02-09 · 浏览1056次

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

大语言模型的推理能力，不再是 AR（自回归）的专属。扩散模型现在也能「动脑子」，新框架 d1 让它们学会了解数学、懂逻辑、会思考。...

2025-04-20 · 浏览546次

物理视频真实生成！大连理工&莫纳什大学团队提出物理合理的视频生成框架

最近，来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。...

2025-04-18 · 浏览675次

从思考到行动：大模型自主工具调用能力的深度实现

GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力：理解上下文关联、拆解多步骤问题、甚至通过思维链（Chain - of - Thoug...

2025-04-17 · 浏览672次

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

当前，所有主流的视觉基础模型（如 SigLIP、DINOv2 等）都仍然在低分辨率（如 384 * 384 分辨率）下进行预训练。...

2025-04-17 · 浏览596次

JHU提出最强ToM方法，AutoToM横扫五大基准

如何让 AI 像人一样思考？如何拥有像人一样的认知能力和社会能力？...

2025-04-16 · 浏览465次

ICLR 2025 | 一行代码！FreDF频域损失稳定提升时间序列预测精度

时间序列预测在气象预报、工业设备维护、医疗监测等领域具有关键应用价值。...

2025-04-15 · 浏览608次

迄今为止最大、最详细的哺乳动物脑连接图，详细展现海量神经元活动

研究人员通过绘制小鼠脑组织中一立方毫米内的细胞图谱，绘制出了迄今为止最大、最详细的哺乳动物脑连接图。...

2025-04-15 · 浏览543次

合成数据助力视频生成提速8.5倍，上海AI Lab开源AccVideo

虽然扩散模型在视频生成领域展现出了卓越的性能，但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。...

2025-04-15 · 浏览419次

面对杂乱场景，灵巧手也能从容应对！NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

在物流仓库、生产线或家庭场景中，机器人常常需要在大量杂乱摆放的物体中高效地抓取目标。...

2025-04-13 · 浏览427次

扩散模型奖励微调新突破：Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破：Nabla-GFlowNet让多样性与效率兼得...

2025-04-13 · 浏览430次

3710亿数学tokens，全面开放！史上最大高质量开源数学预训练数据集MegaMath发布

在大模型迈向推理时代的当下，数学推理能力已成为衡量语言模型智能上限的关键指标。...

2025-04-13 · 浏览451次

传统预训练正走向终结，推理优化与后训练提升有限，大模型今后如何突破发展瓶颈？

高质量数据枯竭，传统预训练走向终点，大模型如何突破瓶颈？...

2025-04-12 · 浏览554次

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

在现实世界中，如何让智能体理解并挖掘 3D 场景中可交互的部位（Affordance）对于机器人操作与人机交互至关重要。...

2025-04-11 · 浏览548次

大模型推理无损加速6.5倍！EAGLE-3碾压一切、延续Scaling Law能力

自回归解码已然成为大语言模型的推理标准。...

2025-04-10 · 浏览797次

类R1强化学习迁移到视觉定位！全开源Vision-R1将图文大模型性能提升50％

图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练，以强化其指令跟随能力。...

2025-04-09 · 浏览524次

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

基于当前观察，预测铰链物体的的运动，尤其是 part-level 级别的运动，是实现世界模型的关键一步。...

2025-04-07 · 浏览456次

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。...

2025-04-07 · 浏览531次

大语言模型变身软体机器人设计「自然选择器」，GPT、Gemini、Grok争做最佳

大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。...

2025-04-06 · 浏览418次