⭐ 今日热点
💡 英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落
IT之家 | 阅读原文

4月23日,英伟达推出Describe Anything 3B(DAM-3B)AI模型,以解决图像和视频特定区域详细描述难题。其核心创新是“焦点提示”和“局部视觉骨干网络”。DAM-3B-Video扩展到视频领域。为解决训练数据匮乏,开发DLC-SDP策略,构建150万局部描述样本语料库。DAM-3B在七项基准测试中领先,平均准确率达67.3%,超越部分模型,为多领域带来新可能。
🌟 技术突破
💡 DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖
新智元 | 阅读原文

谷歌DeepMind与HHMI Janelia研究所合作,用AI打造虚拟果蝇模型。先构建精确三维模型,为MuJoCo引擎添加新功能模拟飞行与抓握。再用深度强化学习和模仿学习,让模型学习真实行为,实现逼真运动,能模拟飞行、爬行,还具视觉导航能力。该模型已开源,有助于深入探索大脑、身体和环境的关系,未来这项技术还会应用于更多动物。
💡 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI
新智元 | 阅读原文

昆仑万维开源多模态推理模型 Skywork-R1V 2.0。它在高考真题测试中表现出色,达到 985 水平,在多权威测试里显著跃升。其创新技术包括引入多模态奖励模型 Skywork‑VL Reward 及混合强化训练机制(MPO、GRPO、SSB)。团队持续开源多款模型,构建模型版图。R1V 2.0 是迈向 AGI 的里程碑,推动开源多模态大模型发展 。
💫 企业动态
💡 Adobe 挑战 OpenAI,安卓 / iOS 版 AI 生图工具 Firefly 蓄势待发
IT之家 | 阅读原文

4月24日CNBC报道,Adobe为挑战OpenAI,计划推出移动版AI图像生成工具Firefly,“很快”登陆iOS和安卓平台。Adobe Firefly副总裁称其目标是成为用户“创意伙伴”,助用户随时捕捉灵感,如通勤时构思创意。此外,Adobe还推出两款全新AI模型,开放Firefly Video Model视频生成工具 。
💡 谷歌:员工若使用 AI 处理行政任务,每年可节省 122 小时工作时间
IT之家 | 阅读原文

4月25日路透社报道,谷歌称若有效培训劳动力,AI带动的英国经济增长有望增4000亿英镑 。“AI Works”试点项目显示,员工用AI处理行政事务每年可省超120小时,平均年节省122小时。约三分之二员工未接触过生成式AI,不少员工有顾虑。简单培训能增强员工信心、提升使用频率。如55岁以上女性,培训前每周和日常使用AI比例低,三个月后大幅上升。
💡 OpenAI 推出轻量级 ChatGPT 深度研究工具,免费用户也能用
IT之家 | 阅读原文

4月25日,OpenAI宣布为ChatGPT Plus、Team、Pro及免费用户推出ChatGPT深度研究工具的轻量级版本。该版本基于o4-mini模型开发,成本低、能提升用户使用限额,回答简短但保持深度质量,超原版本限额时自动切换。当前深度研究工具是各大聊天机器人平台重要功能,类似工具核心在于推理人工智能模型。轻量级工具下周将向企业和教育用户开放,使用限额与Team用户一致。
💡 可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用
IT之家 | 阅读原文

4月24日,Adobe推出全新网页应用Content Authenticity,公测免费,用于保护创意工作者作品署名权。它基于内容凭证认证系统,能嵌入隐形元数据、添加“禁止AI训练”标签,追踪编辑历史。与Behance平台都可通过LinkedIn验证身份。支持批量处理最多50张JPEG/PNG格式图片。虽无法保证AI公司都遵守规定,但有助于防止用户被AI伪造内容误导 。
💡 工信部等七部门:支持医院药企积极引入 AI、开展“人工智能赋能医药全产业链”应用试点
IT之家 | 阅读原文

4月24日,工信部等七部门印发《医药工业数智化转型实施方案(2025—2030年)》。政策支持建医药大模型创新平台,开展相关研发与规则建设;开展“人工智能赋能医药全产业链”应用试点,鼓励龙头企业等组成联合体打造应用场景,建设公共服务平台。目前已有医学机构应用AI,如福建省立医院用AI导诊助手辅助预约挂号。
💡 微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种
新智元 | 阅读原文

微软官宣「AI同事时代」来临,Microsoft 365 Copilot更新,新智能体登场。CEO纳德拉称其是工作重要帮手。微软发布报告预言2025年为前沿公司诞生之年,多数领导者预计智能体将融入公司AI战略。还介绍了「AI同事」多种用法。虽AI智能体尚处早期,CMU实验显示其在实际工作有局限,但仍是企业下注方向 。
💡 50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍
IT之家 | 阅读原文

4月24日,OpenAI首席执行官山姆・奥尔特曼宣布,针对Plus、Team或Enterprise用户放宽模型消息限制,o3从每周50条升至100条,o4 - mini从150条升至300条,o4 - mini - high升至100条。o3是OpenAI强大推理模型,在多领域表现出色,比o1在困难任务上少犯20%重大错误。此次放宽限制,ChatGPT Plus等账户o3消息数翻倍,用户平均每天可访问14条 。
💡 “AI 教父”等发布联名公开信: OpenAI 重组背离初衷,呼吁监管介入
IT之家 | 阅读原文

4月23日,前OpenAI员工等联名发表公开信,呼吁监管阻止其重组计划。OpenAI 2015年为非营利组织,现拟议重组将运营控制权转移,非营利实体失治理权。公开信指出这背离公司使命,缺乏透明度,担忧微软获访问权等。还反驳其简化资本结构说辞。包括“AI教父”杰弗里・辛顿等著名AI研究人员签署此信,敦促相关总检察长调查 。
💡 2万人大裁员!AI掉队、工厂暂停扩张,英特尔复兴之路注定艰难
新智元 | 阅读原文

英特尔再次掀起裁员风暴,计划裁员超20%(约2万多人),这是新任CEO陈立武上任后的首次重大重组,旨在精简管理、重塑工程文化。近年来英特尔在AI领域落后英伟达,连续三年营收下滑。陈立武承诺剥离非核心资产。英特尔推迟工厂扩张计划,与台积电合作可能性降低。此前其前任复兴计划未成功,如今英特尔复兴之路艰难,不过陈立武表示相信能实现复兴 。
💡 挑战第一方 Siri:Perplexity 在苹果 iOS 平台推出 AI 语音助手
IT之家 | 阅读原文

4月23日,AI企业Perplexity为苹果iOS平台应用程序推出AI语音助手功能。该第三方程序能带来近似苹果Siri助手的体验,可通过网页浏览和多应用操作,执行如地图搜索、餐厅预订、邮件草拟、提醒设置及媒体播放等用户语音指令 。
✨ 行业观点
💡 Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知
IT之家 | 阅读原文

4月23日Anthropic发布博文示警,Claude等前沿AI模型被恶意行为者滥用,用于“舆论引导服务”、凭证填充、招聘诈骗及恶意软件开发等。如创建超100个虚假账号传播政治偏见内容、利用Claude处理泄露凭证、低技术用户用其开发恶意软件等。虽未确认实际部署成功,但降低了恶意行为门槛。团队通过技术识别滥用模式,封禁相关账户,还指出AI功能增强,半自主复杂滥用系统或更普遍。