⭐ 今日热点
💡 Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像
IT之家 | 阅读原文

4月25日,Meta AI创新推出Token-Shuffle,旨在解决自回归(AR)模型生成高分辨率图像的扩展难题。因图像合成高分辨率图片计算成本高,限制AR模型应用,扩散模型也有局限。Token-Shuffle通过融合token降低计算成本,能处理最高2048×2048分辨率图像,操作简单兼容性强。实验中,在两大基准测试里表现出色,在文本对齐、图像质量上有优势 。
🌟 技术突破
💡 70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍
新智元 | 阅读原文

莱斯大学团队提出无损压缩框架DFloat11,能将LLM大小减少30%且输出与原始模型逐位相同。团队开发定制GPU内核实现快速在线解压缩,实验表明其能有效压缩模型,推理吞吐量最高提升38.8倍,支持更长上下文长度,成功实现Llama-3.1-405B单节点无损推理。此外,还对比了有损量化技术的性能损失及现有无损压缩方法的局限。
💡 谷歌 DeepMind 推 QuestBench 基准,评估 AI 模型的推理“补漏”能力
IT之家 | 阅读原文

4月25日,谷歌DeepMind团队推出QuestBench新基准,通过约束满足问题框架,评估模型在推理任务中识别和获取缺失信息的能力。该基准将问题形式化,覆盖逻辑推理、规划和小学数学三个领域,按四个难度轴分类。对领先模型的测试结果显示,思维链提示提升性能,Gemini 2.0在规划任务中最佳,开源模型在复杂数学问题上欠佳,当前模型在复杂问题上性能待提升 。
💡 强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏
新智元 | 阅读原文

清华和上交研究团队对可验证奖励强化学习(RLVR)进行研究。此前RLVR被视为打造自我进化大模型的关键。但研究发现,超大k值下RLVR训练模型不如基础模型,它提升采样效率却缩小推理范围,不同RLVR算法表现相似且远未达最优,与蒸馏有本质区别。实验涵盖多领域、模型和算法,还表明基础模型已包含RLVR的推理模式,而蒸馏能拓展推理边界 。
💡 全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源
新智元 | 阅读原文

全球首个去中心化强化学习训练的32B模型INTELLECT-2发布。它无需授权就能用异构计算资源参与,能提升编码等领域推理性能。其基础设施有推理采样等节点,具备消除通信开销等特性。采用异步强化学习,相关框架prime-rl已开源。还介绍了Shardcast、TOPLOC验证、协议测试网等情况。模型训练有多种方法,目前计算池满员,需申请排队贡献算力。它是大规模去中心化强化学习开端 。
💡 OpenAI GPT-4o AI 模型再升级,智能与个性双提升
IT之家 | 阅读原文

4月25日,OpenAI首席执行官山姆・奥尔特曼推文称升级GPT-4o模型。此前OpenAI在发布新模型同时也没停下改进GPT-4o的脚步,今年3月升级后它更直观、有创造力且协作能力提升。此次改进优化了记忆保存时机,提升STEM领域解题能力,微调回应方式使其更主动、引导对话更有效,让其在任务中更直观高效 。
💫 企业动态
💡 “AI 编程”之争:Anthropic 因版权纠纷受批评,OpenAI 意外赢得用户好感
IT之家 | 阅读原文

4月27日外媒报道,在Anthropic的Claude Code和OpenAI的Codex CLI两款AI编程工具较量中,后者更受开发者青睐。原因包括Anthropic曾对逆向工程开发者发下架通知,Claude Code使用许可更严格,源代码混淆且难获取,而Codex CLI许可证开放,发布一周就吸收众多开发者建议,还能调用其他模型。Claude Code尚处测试有bug,未来Anthropic或宽松发布源代码,其混淆或出于安全考虑,目前Anthropic未回应 。
💡 首届具身智能机器人运动会在无锡举行:超 150 名“选手”上场比拼
IT之家 | 阅读原文

4月25日上午9时35分,首届具身智能机器人运动会在无锡举行。超150台机器人参与10个项目比拼,100余家科研团队、企业及高校代表参与,场馆面积2000平方米。运动会设4大类奖项,展现技术成果与应用成效。由中国电子学会主办,赛事旨在汇聚资源打造产业高地。人类裁判将多维度评判,优胜团队获荣誉证书及万元奖金 。
💡 中国成为全球人工智能专利最大拥有国,占比 60%
IT之家 | 阅读原文

4月26日,国家知识产权局局长申长雨称,中国拥有的全球百强科技集群数量连续两年位居世界之首,已成全球人工智能专利最大拥有国,占比达60%。2024年我国多项知识产权数据可观。在《2024年全球创新指数报告》中我国排名升至第11位。近年来,国家知识产权局推进人工智能领域知识产权制度创新,未来还将加快建立相关保护规则,加大审查服务力度,推动完善国际规则标准。
💡 OpenAI 推出轻量版 Deep Research AI 搜索功能,基于 o4-mini 打造
IT之家 | 阅读原文

4月26日,OpenAI面向付费及免费用户推出基于o4 - mini模型的“轻量版”Deep Research AI搜索功能。因2月推出的Deep Research功能受欢迎,此次推轻量版以服务更多用户。轻量版回复内容较短但质量良好,搜索准确率为45.6 。不同会员有不同使用额度,免费版用户每月可用5次轻量版,无法用标准版。使用额度每30天重置一次 。
💡 央视曝光不法分子利用 AI 伪造“非遗传承人形象”虚假宣传,高价销售低质产品
IT之家 | 阅读原文

2025年4月26日消息,央视曝光不法分子利用AI伪造“非遗传承人形象”虚假宣传。以“苗古金贴”为例,涉事企业宣称产品由AI生成的虚拟人物“唐付政”研发,“非遗证书”违规办理,成本2.5元/盒的产品以59元高价销售,还通过不正当手段登上回购榜榜首。目前厦门集美区市场监管局已核查,责令下架产品链接,移交假证线索。央视提醒消费者警惕相关产品,有关部门需加强电商平台监管。
💡 GPT-4.5功臣遭驱逐!奥特曼盛赞工作出色,美国深陷AI人才危机
新智元 | 阅读原文

近日,GPT-4.5核心开发者之一Kai Chen绿卡申请被拒,或被迫离美,多名OpenAI员工担忧影响美国AI领先地位。同时,1700多名国际学生和研究人员签证审查受阻,H-1B签证审查趋严。研究显示,移民对美国AI创业公司贡献大。此外,Nature调查表明75%美国科学家考虑逃离,原因包括移民政策、经费削减等。部分人想抄底人才,也有人因美国科研设施顶尖而留下。
✨ 行业观点
💡 美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI
新智元 | 阅读原文

4月25日美国公开各界对「AI行动计划」的10068份书面意见。OpenAI、Anthropic主张加强对中国技术封锁,限制高端芯片和模型权重流向中国。Meta强调开源AI,反对出口管制;谷歌批评拜登政府出口管制;微软、亚马逊提一般性建议;英伟达等巨头未提交意见。此外,传统科技巨头一致认为美国应加大AI政务应用策略 。