⭐ 今日热点
💡 力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用
IT之家 | 阅读原文

4月22日消息,谷歌Gemini 2.5 Pro成首款能完全理解PDF布局的AI模型。3月25日发布实验模型,4天后向全球用户开放。它不仅能提取文本,还能理解视觉布局,具备“原生视觉”能力,有超大上下文窗口。AI初创公司联合创始人赞扬其在PDF视觉引用上的表现。相比其他模型,它以0.804的IoU精度大幅领先,还能提取结构化数据并标注来源 。
🌟 技术突破
💡 智能软体仿生观赏鱼“金鳞”亮相,在水族馆、公园有望“以假乱真”
IT之家 | 阅读原文

4月20日,上海海洋大学的智能软体仿生观赏鱼“金鳞”亮相。它以金龙鱼为原型,融合人工肌肉驱动、人工智能算法等技术,能精准模拟金龙鱼游动姿态和习性,有“以假乱真”视觉效果。团队负责人陈新军称,“金鳞”应用场景广,在水族馆、主题公园可提升观赏性与互动体验,未来游客能用遥控器与“金鳞”互动 。
💡 京瓷、筑波大学共同开发 AI 小憩辅助系统:剑指“午休神器”
IT之家 | 阅读原文

4月22日消息,据共同社19日报道,京瓷与筑波大学联合开发出AI小憩辅助系统,4月起向企业付费租赁并实地测试。该系统通过耳部血流量数据判断睡眠阶段,在最佳时机唤醒用户以提升工作效率,目标明年春季商品化。系统还有新技术,通过在左右耳播放不同频率入眠音缩短进入“睡眠阶段2”时间,进入该阶段音频自动关闭。多数用户闭眼约20至30分钟可进入唤醒时刻。
💡 AI永生时代来临!DeepMind「生成幽灵」让逝者赛博重生
新智元 | 阅读原文

DeepMind与科罗拉多大学提出「生成幽灵」,能基于逝者数据打造可生成新内容的数字智能体,实现与逝者“对话”。它是哀悼机器人概念的延伸,从来源、部署时间等多维度设计。这一技术既能带来情感慰藉、传承知识,也有心理、声誉等风险。需在设计界面、政策制定等方面降低风险,若技术进步、成本降低,有望被更多人接受。
💡 AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行
新智元 | 阅读原文

马普所、加州理工等机构科学家借助 AI 算法 Urania 设计出人类尚未理解的引力波探测工具,将可观测宇宙体积扩大 50 倍。AI 给出超人类的全新实验设计,部分设计能大幅提高灵敏度。研究还发现新物理思想核心,该方法可扩展到多领域。此成果发表于「Physical Review X」,50 种最佳设计已公开 。
💡 昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代
IT之家 | 阅读原文

4月21日,昆仑万维发布并开源全球首个用扩散强迫框架的无限时长电影生成模型SkyReels-V2。它结合多种技术协同优化,突破视频生成技术边界。现有技术有诸多限制,SkyReels-V2实现技术突破,有多种应用场景,现已能生成30秒、40秒高质量视频,运动动态表现优异,能满足电影制作对高质量运动的需求。还给出了开源及论文地址 。
💡 选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?
IT之家 | 阅读原文

OpenAI 新模型让人眼花缭乱,Every 和 DataCamp 团队测试后给出选择建议。o3 是最新旗舰,深度推理与工具调用强,性能跃升且性价比高;o4‑mini 速度快、成本低,工具全,o4‑mini‑high 适合复杂任务;GPT‑4.1 仅通过 API 开放,执行指令精准,上下文窗口大。还对比了它们与竞品的表现,如 GPT‑4.1 指令执行拉近与 Claude 3.7 Sonnet 的差距,o4‑mini 成有限预算下的「平价首选」。
💡 95后打造世界首个行动型浏览器——Fellou,从「浏览」到「行动」一键直达!
新智元 | 阅读原文

全球首个行动浏览器Fellou发布,它融合Browser、Agent、Workflow Automation,从传统信息展示工具变为智能生产力平台。Fellou有深度行动等四大核心能力,能自动拆解任务、跨网页操作。经用户测评,其综合评分和执行速度优于同类产品,执行费用低。它还采用混合反馈经验学习框架提升智能体能力。目前已开启全球内测,即将开源评估Benchmark。
💡 选AI比选对象还难!起名黑洞OpenAI的新模型,到底怎么选?
新智元 | 阅读原文

Every和DataCamp团队测试了OpenAI的o3、o4-mini、GPT-4.1三款模型。o3是最强推理模型,工具调用和视觉推理出色,技术有创新且性价比高;o4-mini速度快、成本低,性能与o3相当,有o4-mini和o4-mini-high两种选择;GPT-4.1通过API开放,精准执行指令,上下文窗口大,有结构化输出。此外,还对比了它们与竞品的表现 。
💡 采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
新智元 | 阅读原文

近期AI领域有多项进展。微软开源“原生1bit”三进制LLM,2B参数,低内存需求。ICLR 2025 Oral论文分析任务向量做模型编辑有效的理论。UCLA、Meta开源d1框架用于扩散LLM推理,8卡32B模型提出层次化RL推理新范式。此外还有首个融合重建-预测-规划的生成式世界模型AETHER开源等成果。
💡 讯飞星火 X1 全新升级,整体效果对标 OpenAI o1 和 DeepSeek R1
IT之家 | 阅读原文

4月21日科大讯飞官宣讯飞星火X1全新升级,号称是基于全国产算力训练的深度推理大模型。升级后通用任务效果显著提升,模型泛化性进步,在教育等重点行业扩大领先优势。首发快慢思考统一模型,部署简便;升级模型定制优化工具链,定制门槛低。三大核心技术创新助力升级。多个任务效果突破,已在网页端、App上线,API也面向开发者和企业开放服务。
💫 企业动态
💡 哥伦比亚大学两位退学生打造“AI 面试作弊神器”,拿下 500 万美元融资
IT之家 | 阅读原文

据外媒 4 月 22 日报道,21 岁的 Chungin “Roy” Lee 的初创企业 Cluely 完成 530 万美元种子轮融资。该公司主打 AI 工具,其核心产品 Interview Coder 能帮用户在考试、面试等场景“作弊”。Lee 靠此工具获亚马逊实习机会。该工具源于两人开发的帮助程序员应对 LeetCode 题目的工具,因其被哥大停学,现两人已退学。本月初该 AI 工具年度经常性收入突破 300 万美元。
💡 ChatGPT 搜索在欧洲增长迅猛,欧盟监管利剑高悬
IT之家 | 阅读原文

4月22日消息,OpenAI报告显示,ChatGPT Search过去六个月在欧盟活跃用户数显著增长,截至2025年3月31日的六个月,平均月活约4130万,较2024年10月31日的六个月的约1120万有大幅增长。因欧盟DSA规定,月活超4500万为“超大型”平台,将面临更严监管,违规会被重罚。ChatGPT Search已获一定市场份额,但可靠性存问题,如搜索文章67%结果被误识。谷歌仍主导搜索市场,处理搜索量是ChatGPT的373倍。
💡 天翼 AI 开放平台上线,支持中国电信自研星辰大模型
IT之家 | 阅读原文

4月21日,中国电信的天翼AI开放平台正式上线并面向公众开放。个人用户能一站式用星辰大模型多种能力;政府和企业用户可体验多种开发平台能力及近30款核心产品,满足数字化创新需求。星辰大模型是全国产化万亿参数大模型,在多领域有突破。语音模型能支持50种方言混识,超自然语音生成相似度超90%;视觉模型日均调用6亿多次。它率先开源,全尺寸覆盖,累计下载超4万次。
💡 TrendForce:预计中国市场 2025 年人形机器人本体产值将超 45 亿
IT之家 | 阅读原文

TrendForce集邦咨询称,中国市场有11家主流人形机器人本体厂商2024年开启量产计划,6家厂商2025年产量规划超千台。预计2025年中国市场人形机器人本体产值超45亿元。马斯克提出Tesla Optimus 2025年数千台量产目标,将拉动中国市场零部件供应链发展。当下人形机器人多用于B端,C端应用商业化落地因功能等要求高,仍面临诸多挑战,需多方面共同努力 。
💡 行业首款,智元发布具身智能一站式开发平台 Genie Studio
IT之家 | 阅读原文

4月21日,智元机器人发布行业首款面向具身智能开发者的一站式开发平台 Genie Studio。该平台具备全链路产品能力,优势明显:数据采集单机单日产能达1000条;提供多种基座模型,降低训练门槛;有6000 +物体资产与仿真场景;“一键真机部署”性能比传统方案单卡提升2 - 3倍。其涵盖数据采集、模型训练、仿真评测、模型推理等模块,助力具身智能发展 。
💡 特斯拉机器人史上最大规模招聘:三年打造 50 万台规模,不仅送进厂还要送“上天”
IT之家 | 阅读原文

2025年4月21日消息,特斯拉机器人团队大规模招聘,与擎天柱相关岗位约80个。岗位分布在美国多地生产基地,涵盖设计到制造全链条,66%集中在人工智能与机器人技术。此次招聘突出“专”与整合能力,多数岗位“能力至上”。马斯克透露擎天柱今年试生产,目标生产零部件1万 - 1.2万台,今年产量达5000台算成功,明年下半年对外销售。未来产量将大幅提升,其将用于替代重复工作及特殊环境,还可能上火星。
💡 深圳大学人工智能学院正式揭牌成立,打造本硕博一体化 AI 人才培养体系
IT之家 | 阅读原文

4月21日,深圳大学人工智能学院正式揭牌成立。学院建设基础学科研究中心和算力平台,与腾讯云共建产业学院,拥有约80人教研团队,含多位院士及国家级人才。学院构建本硕博一体化专业体系,秉持特定理念培育AI人才。此外,今年2月13日,香港中文大学(深圳)已成立人工智能学院,计划9月招首批学生 。
💡 o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩
新智元 | 阅读原文

OpenAI的o3和o4-mini在视觉推理方面取得突破,却遭质疑可能使用他人研究成果。华盛顿大学博士生施惟佳、滑铁卢大学陈文虎等提出质疑,OpenAI研究人员回应否认。此外,谢赛宁就“用图思考”提出5点思考,并指出相关人员曾与他讨论。同时,o3在数学基准测试成绩也受争议,实际得分与官宣差距大,AI基准测试“水分”问题引发关注。