⭐ 今日热点
💡 谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
IT之家 | 阅读原文

4月10日谷歌推出注重高效能的全新AI模型Gemini 2.5 Flash,即将登陆Vertex AI。该模型计算能力“动态且可控”,能灵活调整速度、准确性和成本平衡,价格低性能佳,适合高容量和实时应用场景。不过谷歌未发布其安全或技术报告。此外,谷歌计划三季度将Gemini模型引入本地环境,与英伟达合作将其引入符合GDC标准的英伟达Blackwell系统。
🌟 技术突破
💡 英伟达华人AI版《猫和老鼠》爆火全网,60秒经典泪目!仅靠Transformer新增一层
新智元 | 阅读原文

英伟达、斯坦福等机构联手打造基于TTT的一分钟视频生成器,让经典《猫和老鼠》有新情节。仅在预训练Transformer嵌入TTT层,5B参数模型就能理解复杂提示生成长达1分钟视频。TTT层创新RNN层隐藏状态更新方式,表达能力强。生成视频时对架构、流程等优化,数据集基于《猫和老鼠》构建。评估显示,TTT - MLP在场景一致性等方面表现佳,平均比第二好的方法高出34 Elo分 ,但生成视频也存在瑕疵 。
💡 AI 助 86 岁经典老片重获新生:谷歌拟将《绿野仙踪》搬上拉斯维加斯巨型球幕
IT之家 | 阅读原文

据外媒报道,Sphere Entertainment 将打造沉浸式《绿野仙踪》。谷歌、Magnopus 等公司借助 AI 技术升级这部 86 年的老片,用于在巨型球幕播放。谷歌团队调用精调模型提升画质、扩展背景、还原角色等,AI 处理超 90%内容。为精准补全画面,还参考诸多档案资料。影片 2025 年 8 月 28 日首映,届时或加入多感官体验 。
💡 字节人像视频模型DreamActor-M1推特关注超百万!即梦AI即将上线
新智元 | 阅读原文

继数字人技术Omnihuman-1后,字节智能创作团队推出DreamActor-M1人像视频模型。它基于DiT架构,用一张照片和一段视频就能生成电影级视频,精准迁移表情动作,支持多种画风。该模型在多方面优化,表现力与易用性强。即将上线即梦AI,平台会严格审核内容并加水印。字节跳动智能创作团队技术领先,未来还将带来更多体验。
💡 谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务
IT之家 | 阅读原文

4月10日谷歌在Cloud Next大会宣布,AI编程助手Gemini Code Assist新增“代理”功能。此功能可多步骤完成复杂编程任务,如依产品规格创建应用、转换代码语言等,还支持多编程环境。升级或为应对竞争,“代理”功能通过看板管理,能生成计划、报告进度。不过,先进代码生成AI常因理解不足引入漏洞错误,使用Code Assist需亲自审查代码。
💡 谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍
IT之家 | 阅读原文

4月9日,谷歌在Google Cloud Next 2025大会发布第七代TPU张量处理器“Ironwood”,这是首款专为AI推理设计的TPU。它代表AI基础设施重大转变。芯片参数出色,每颗搭载192GB的7.2Tbps HBM内存等。谷歌为云客户提供两种规模的“Ironwood” TPU Pod配置,9216芯片配置整体AI算力达42.5 Exaflops ,能效是TPU v6e “Trillium”两倍。
💡 UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!
新智元 | 阅读原文

UC伯克利和Together AI联合推出开源代码推理模型DeepCoder-14B-Preview,14B参数媲美o3-mini。其在LiveCodeBench测试中单次通过率达60.6%,提升8%。团队还开源verl-pipe,让训练速度提高2倍。该模型基于24K个编程问题,在32个H100 GPU上训练2.5周。此外,在训练方法、数据集构建、代码沙盒环境等方面有创新,采用多种技术提升性能。
💡 孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
新智元 | 阅读原文

北大陈宝权教授团队提出RainyGS技术,被CVPR 2025接收。该技术结合物理模拟和3D高斯泼溅渲染框架,以表面表达为核心,融合几何重建、仿真与渲染,突破传统局限,能实时生成逼真动态雨效,支持动态调节,为自动驾驶、游戏开发等领域带来新可能,还为数字孪生等提供全新动态解决方案,展现重塑技术标准的潜力。
💫 企业动态
💡 继 OpenAI 后,谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议
IT之家 | 阅读原文

继 OpenAI 后,谷歌跟进支持 Anthropic 的 MCP 协议。谷歌 DeepMind 首席执行官德米斯・哈萨比斯称将为 Gemini 模型和 SDK 添加对 MCP 协议的支持,但未提及具体时间。哈萨比斯认为 MCP 是很好的协议,有望成 AI 代理时代开放标准。MCP 协议由 Anthropic 推出,可实现大语言模型与外部数据源和工具集成,此前已有多家公司支持该协议 。
💡 谷歌重申今年 750 亿美元资本支出计划:斥巨资购买芯片、服务器,持续押注生成式 AI
IT之家 | 阅读原文

4月10日路透社报道,谷歌母公司Alphabet重申今年投入约750亿美元(约合5519.45亿元人民币)扩建数据中心,押注生成式AI,资金用于采购芯片和服务器。首席执行官桑达尔・皮查伊称AI机会巨大。此前Alphabet公布的投资计划超出华尔街分析师预期29%。此外,微软今年将投超800亿美元,Meta预计投多达650亿美元建设AI基础设施。自ChatGPT推出后,AI领域投资激增,各大公司争夺技术主导权 。
💡 OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系
IT之家 | 阅读原文

2025年4月10日,OpenAI宣布启动先锋计划,旨在重塑AI模型评分体系。因现有AI基准测试有缺陷,该计划将为法律、金融等特定领域创建基准测试,未来几个月与多家公司合作设计并公开测试及评估。首批参与者聚焦初创公司,其可与OpenAI团队合作,用强化微调技术改进模型。不过,AI社区是否接受由OpenAI资助创建的基准测试存疑,此前其相关举动曾有道德争议 。
💡 Anthropic 推出 Claude Max 订阅计划,月费最高 200 美元
IT之家 | 阅读原文

4月10日,Anthropic推出AI聊天机器人Claude的全新订阅计划Max,被视为对OpenAI ChatGPT Pro 200美元月订计划的回应。Max有100美元和200美元两个版本,速率限制分别是Claude Pro的5倍和20倍。前沿AI模型开发者探寻增收途径,OpenAI相关年化收入增长3亿美元。Anthropic产品负责人表示不排除推更昂贵计划,还在探索教育领域项目。新模型Claude 3.7 Sonnet引发大量需求 。
💡 「千匹马力」被比亚迪打成白菜价:最新汉唐21万起售,比小米SU 7Ultra更小米!兆瓦闪充高阶智驾都标配
量子位 | 阅读原文

比亚迪最新汉/唐L正式上市,起售价20.98万元。其搭载多项前沿智能汽车黑科技并标配,如1000V平台、兆瓦闪充等。智能方面,天神之眼B高阶智驾有亮点,数据和算法优势明显。电动层面,充电、散热、电控等技术突破,规划大量超充站。四驱混动DM-p升级,油耗降低、性能提升。比亚迪用技术展现‘统治力’,将高性能新能源车价格打低,推动行业发展。
💡 广汽人形机器人 GoMate 亮相:明年小批量生产,未来可当 4S 店销售、进厂
IT之家 | 阅读原文

4月9日,广汽在广东省人工智能与机器人产业创新产品与服务新闻发布会上,发布第三代具身人形机器人GoMate。负责人张爱民称,车企制造人形机器人有技术优势,应用场景广。GoMate采用“轮足结合”构型设计,应用传统算法,自由度多,驱动器“小体积、大功率”,有灵巧手,核心部件自研。广汽计划今年自研零部件全球发售,GoMate不同行业示范应用,2026年整机小批量生产。
💡 5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
新智元 | 阅读原文

近期多领域动态不断。科技界,阿里前高管等入职英伟达,传OpenAI豪掷36亿收购AI硬件公司;学术圈,本科生推翻图灵奖得主猜想;汽车行业,小米报案辟谣,周鸿祎探店小鹏下单。此外,还有国际关系动态,如中方约谈特斯拉,美方“对等关税”4月9日生效,以及台湾相关话题,如台积电受关注等。3月AI月报显示全球AI双端下载2.6亿。
💡 GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」
新智元 | 阅读原文

OpenAI痛失人才,前核心成员Alec Radford和Bob McGrew加入OpenAI前CTO Mira Murati创立的新公司Thinking Machine Lab。Alec是GPT开山一作,研究影响深远,谷歌学术引用22万。Bob在OpenAI任职近8年,总引用27K。新公司计划筹资10亿美元,估值约90亿,已有超1亿美元资金,目前无明确研究议程和产品路线图,众多OpenAI前员工加入 。
✨ 行业观点
💡 MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
IT之家 | 阅读原文

几个月前有研究暗示AI会发展出“价值体系”,但MIT最新论文称AI并无连贯价值观。研究共同作者表示,让AI系统“对齐”(以期望、可靠方式行事)比想象更具挑战,因其会“幻觉”和模仿,难以预测。研究团队调查多个模型,发现无模型偏好一致,提示措辞和框架不同观点迥异。共同作者斯蒂芬・卡斯珀强调模型“不一致且不稳定”,难内化人类偏好 。