⭐ 今日热点
💡 2025 商汤技术交流日 4 月 10 日举行,日日新 6.0“强推理”模型首秀
IT之家 | 阅读原文

IT之家4月7日消息,商汤科技官微宣布“2025商汤技术交流日”于4月10日14时举行,将推出主打“强推理”的日日新6.0 AI模型。去年7月5日商汤发布日日新5.5大模型体系及国内首个所见即所得模型“日日新5o”。日日新5.5是国内首个流式原生多模态交互模型,基于超10TB tokens高质量数据训练,有6000亿参数,推理速度达109.5字/秒 。
🌟 技术突破
💡 数学大一统的惊人胜利!天才数学家用30年破解不可能,边看《星战》边写论文
新智元 | 阅读原文

数学家Dennis Gaitsgory凭借对几何Langlands Program的证明获突破奖300万美元。历经30年,他与8位同事在5篇近1000页论文里完成证明。该纲领由Robert Langlands提出,旨在联系数论与调和分析 。2022年关键步骤解决后证明有希望。证明95%由Dennis完成,他希望更多人参与研究,可通过举办讲座等吸引新人,带来新思路。
💡 中国科学院青藏高原研究所、阿里云联合发布水能粮多模态推理大模型“洛书”
IT之家 | 阅读原文

4月7日,中科院青藏高原研究所联合阿里云发布水能粮多模态推理大模型“洛书”。它集成多个模型,预测准确率达98%(SOTA级别),相比传统方法准确率提升近20%。底层科学模型经“云工开物”计划支持、依托阿里云ECS训练。接入推理和多模态模型后,用户能用自然语言分析高维数据。“洛书”已在区域水电龙头企业完成两轮内测,可助力资源配置与调度,为解决相关波动性问题提供创新方案 。
💡 LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略
新智元 | 阅读原文

来自美国多所大学的研究团队提出知识遮蔽定律,揭示、预测并减少LLM幻觉。研究发现幻觉的对数线性规律,能在训练或推理前预测幻觉,提出解码策略CoDA提升模型事实性。还深入研究幻觉产生机制,如知识遮蔽导致幻觉,且发现其与记忆规律相似,或为泛化阶段副产物。实验表明CoDA可提升模型性能,为开发可控语言模型提供见解。
💡 CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
新智元 | 阅读原文

杨立昆、谢赛宁等研究人员探讨视觉自监督学习(SSL)在多模态建模的潜力。通过实验,发现扩展模型和数据规模后,视觉 SSL 在 VQA 任务中能媲美甚至超越语言监督方法,在传统视觉任务上也具竞争力。研究团队推出 Web-SSL 模型系列,计划开源以推动社区探索,还探讨了模型在规模扩展上的表现,证明视觉 SSL 有巨大开发潜力 。
💡 中国科大新成果入选 ICLR 2025:特定领域仅用 5% 训练数据,知识准确率提升 14%
IT之家 | 阅读原文

中国科学技术大学王杰教授团队提出创新框架 KG-SFT,入选 ICLR 2025。该框架针对大语言模型(LLMs)领域知识理解和推理能力弱的问题,通过知识图谱增强监督微调,包含三个关键组件。实验表明,在低数据医学问答任务英语场景中,仅用 5%训练数据,知识准确率比传统方法提高近 14%,且可与现有数据增强方法结合,提升 LLMs 在特定领域性能 。
💡 中美 AI 挑战东京大学入学考试:双双合格,英语优异,数学欠佳
IT之家 | 阅读原文

据日经新闻4月5日报道,中美两国新型生成式AI “o1”和“R1”参加东京大学理科3类入学考试双双合格。理科满分550分,“o1”得374分、“R1”得369分。英语得分率超75% ,远超考生平均水平;数学虽正确答案多,但图形论证有问题,“o1”得38分、“R1”得49分,低于合格者平均分。新井纪子教授称这是AI成长重要里程碑,也需能正确使用AI输出的人才。
💫 企业动态
💡 消息称谷歌付钱让部分 AI 员工赋闲一年,以防其投奔竞争对手
IT之家 | 阅读原文

人工智能领域竞争激烈,谷歌旗下DeepMind为防员工流向对手,对英国部分员工采取“激进”竞业禁止协议,离职一年内不得为对手工作,期间仍付薪水。这让一些研究人员觉被边缘化。美国联邦贸易委员会去年禁多数竞业禁止协议,但不适用于DeepMind伦敦总部。微软人工智能副总裁称,有DeepMind员工因竞业条款向其“绝望求助”,谷歌表示“有选择地”使用该协议。
💡 谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能
IT之家 | 阅读原文

4月8日,谷歌宣布旗下Gemini Live AI的“Live Camera(实时拍摄)”及“Screenshare(识图导购)”功能,现已支持Pixel 9系列手机和三星Galaxy S25 ,后续还将支持更多安卓设备。不过,只有付费的Gemini Advanced用户能使用这些新功能。“Live Camera”可让用户按下按钮激活实时拍摄并询问相机所见内容;“Screenshare”能帮用户找到截图或照片中的同款商品及定价 。
💡 Kimi 开放平台模型推理服务降价
IT之家 | 阅读原文

4月7日,Kimi开放平台基于Moonshot AI的技术积累和性能优化,对模型推理服务进行价格调整。kimi-latest模型自动缓存后价格仍为¥1 / M Tokens,上下文缓存价格有调整。平台称通过技术创新降低了推理成本、提高了速度,得以将成本优势体现到Tokens定价上,让用户以实惠价格享受服务。
💡 2025 CSRankings 排名出炉:上交大、清华北大、浙大霸榜全球 AI TOP 10
IT之家 | 阅读原文

2025 CSRankings 全球计算机科学排名发布,CMU 居首,中国高校表现亮眼,清华第 2,上交大与浙大并列第 3,北大第 5,中国科学院与哈工大跻身前十。该排名由 Emery Berger 组织,基于研究指标,以高校和研究机构在计算机科学领域顶级学术会议上发表的论文数量为依据。还介绍了排名细分领域、教职工入选标准、作者署名及论文数计算方法等。
💡 2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10
新智元 | 阅读原文

2025 CSRankings全球计算机科学排名发布,CMU位居全球第一,中国高校表现抢眼,清华第2,上交大与浙大并列第3,北大第5,中国科学院与哈工大跻身前十。该排名由Emery Berger组织,基于研究指标,以高校和研究机构在计算机科学领域顶级学术会议上发表的论文数量为依据。还介绍了排名细分领域、教职工入选标准、作者署名及论文数计算方法等内容 。
💡 Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
新智元 | 阅读原文

Llama 4发布首日便状况频出。代码实测能力崩盘,网友不满其表现,与顶尖模型差距大。还被曝训练作弊,内部员工称高层建议在训练中混入测试集提升指标,已有员工愤而辞职,研究部副总裁也申请辞职。有网友对比Llama 4与GPT-4o表现,凸显Llama 4不足,且它在LMarena存在过拟合嫌疑。这让Llama 4未来充满不确定性 。
💡 Meta Llama 4 发布 36 小时“差评如潮”,匿名员工爆料拒绝署名技术报告
IT之家 | 阅读原文

Meta发布的基础模型Llama 4在发布36小时后“差评如潮”。用户抱怨集中在代码能力,如“氛围编程”测试表现差,第三方基准测试排名末尾。在EQBench测评的长文章写作中也垫底。此外,有匿名员工爆料拒绝署名技术报告,还有人提及数据泄露、版权诉讼等问题,年初的匿名爆料也被重提,让人对Llama 4的表现和Meta内部情况产生诸多猜测 。
💡 IDC:2028 年中国 AI 总投资规模将突破 1000 亿美元,五年复合增长率达 35.2%
IT之家 | 阅读原文

IDC发布《全球人工智能和生成式人工智能支出指南》。2024年全球AI总投资3158亿美元,2028年将增至8159亿美元,CAGR为32.9% ,生成式AI到2028年规模将达2842亿美元,占比35%。中国引领亚太AI市场,2028年总投资将突破1000亿美元,CAGR为35.2%。2024年中国生成式AI投资占比18.9%,2028年将达30.6%,超300亿美元,CAGR为51.5%。软件和信息服务等是AI投资最多的三个行业,AI对其助力明显。
✨ 行业观点
💡 奥特曼力挺年轻人「套壳」,25年程序员效率暴增10倍!GPT-4o狂造十亿图像
新智元 | 阅读原文

奥特曼在访谈中回应吉卜力争议等话题。他认为代码自动化2025 - 2026年实现,能让程序员效率提升10倍;OpenAI将生成10亿张图像,AI改变创作形式但利大于弊;新职业如prompt工程师会出现,不应被嘲笑;创业门槛因AI降低,被指“套壳”也可能成功;还称对AI不屑的公司会陷入困境,个人要积极拥抱AI 。
💡 联合国警告:AI 可能影响全球 40% 工作岗位,并拉大国家间差距
IT之家 | 阅读原文

联合国贸易和发展机构报告预测,到 2033 年人工智能市场价值将达 4.8 万亿美元。但目前其好处集中在少数地区和企业。该机构担忧人工智能或影响全球 40%工作岗位,还会加剧不平等。国际货币基金组织等也曾警告。报告指出国家间在人工智能领域不平等,建议建立公开披露机制等实现包容性增长,强调各国需积极作为让人工智能惠及所有人。
💡 微软 AI 版《雷神之锤 2》遭喷:模糊、耗电,亵渎开发者工作
IT之家 | 阅读原文

微软推出由Muse驱动的AI版《雷神之锤2》技术演示版,仅作技术展示,存在交互模糊、耗电、遗忘物体等局限。这引发大量用户不满,被指模糊耗电且亵渎开发者工作。此前微软CEO纳德拉计划推系列AI游戏。对于生成式AI在游戏行业的应用,各方观点不一,如Take-Two的泽尔尼克认为会增加岗位,《双人成行》导演法雷斯建议开发者与AI合作 。