⭐ 今日热点
💡 商汤日日新 SenseNova V6 多模态融合大模型发布
IT之家 | 阅读原文

4月10日,商汤发布“商汤日日新 SenseNova V6”多模态融合大模型,具备最长64K思维链等多种能力,支持10分钟视频推理及深度推理。日日新是商汤2023年4月推出的大模型体系,包含“商量”等。该体系后续有诸多进展,如2023年8月获批上线,2024年发布粤语版,2025年1月交互版商用 。
🌟 技术突破
💡 预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化
新智元 | 阅读原文

港中文、清华等高校提出SICOG框架,重塑大模型进化路径。该框架构建三位一体自进化机制,引入独创技术和机制,实现模型自我进化。实验表明,SICOG能显著提升模型综合表现,降低对高质量数据依赖,实现动态认知进化等。此外,合成数据预训练有效,变体方法中偏好学习优于传统监督微调。此框架为迈向自主学习型智能体奠定基础。
💡 广电总局:广电视听智能体开发工具在短视频创作领域得到应用,将向全行业开源
IT之家 | 阅读原文

4月10日,国家广播电视总局称,广科院研发的广电视听智能体开发工具,集成多个国产开源大模型。该工具实现节目策划创作全流程智能化,有多种功能,支持可视化创作。已联合虎牙创作相关作品并上线。下一步,广科院将向全行业开源此工具,助力广播电视和网络视听行业高质量发展 。
💡 勇克FPGA难题!UCLA丛京生教授斩获2024年ACM计算突破奖
新智元 | 阅读原文

2024年ACM计算突破奖授予UCLA华人教授丛京生,以表彰他在FPGA芯片设计自动化等领域的贡献。他开发系列工具,降低FPGA使用难度,实现用C等语言编程。其成果推动相关公司成立和技术商业化,还设计多种硬件加速器,提升能效。此外,丛教授多次推动芯片领域发展,提出半导体芯片领域三次拐点等观点。他荣誉众多,在国内外科研教育领域贡献杰出。
💡 谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级
IT之家 | 阅读原文

4月10日,谷歌升级视频AI模型Veo 2,新增修复、外扩、插值等功能,能生成更具电影感视频。还更新了文本转图像生成器Imagen 3的编辑功能,提升移除物体效果。音频领域,推出文本转音乐模型Lyria预览版,为Chirp 3增加新功能。此外,Gemini 2.5 Flash即将登陆Vertex AI,更新企业Agentic AI工具,云市场将推新板块。卡夫亨氏数字体验负责人称使用Veo 2和Imagen 3大幅缩短制作时间。
💡 大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench
IT之家 | 阅读原文

4月10日,豆包团队开源首个多语言代码修复基准Multi-SWE-bench,可提升大模型“自动修Bug”能力。它在SWE-bench基础上,首次覆盖Python外7种主流编程语言,历时近一年构建。其特性包括覆盖多语言、有难度分级,1632个实例源于真实开源仓库并经审核筛选。还附上了论文、榜单、代码、数据等开源链接 。
💡 得州大学奥斯汀分校开发新型 AI 智能体 Metamon:能像人一样玩宝可梦
IT之家 | 阅读原文

4月10日,美国得克萨斯大学奥斯汀分校的Yuke Zhu助理教授团队发布AI智能体“Metamon”,它能像人类一样进行宝可梦对战。开发中利用超47.5万次人类宝可梦对战数据,还使用非人类对手训练了20个智能体。该智能体参加“Pokémon Showdown”排名战,部分进入活跃用户前10%。小组计划未来构建研究专用服务器,以便跟踪进展 。
💫 企业动态
💡 亚马逊 CEO 安迪・贾西呼吁企业大力投资 AI:高投入是为了高回报
IT之家 | 阅读原文

亚马逊CEO安迪・贾西在致股东年度信函中呼吁企业大力投资AI以获丰厚回报。亚马逊今年2月计划2025年投入超1000亿美元资本支出,多数用于增强AWS的AI能力。贾西称AI正带来前所未有的变革,当前主要开支是数据中心和芯片,未来成本将降低,如Trainium2芯片性价比高。他还表示未来资金将更多投入推理,亚马逊正开发超1000个生成式AI应用,AI收入呈数位数年增长,已达数十亿美元规模。
💡 在线设计平台 Canva 新增多项 AI 技能:图片生成、互动编程、电子表格等
IT之家 | 阅读原文

4月11日,在线设计平台Canva宣布将添加一系列新AI功能,如能完成多种任务的AI助手Canva AI、可创建小型应用的Canva Code 。其照片编辑器加入新AI功能,Canva Sheets新增Magic Insights和Magic Charts功能。Canva联合创始人兼CEO Melanie Perkins曾称设计界需更多“Adobe替代品” ,为专业设计师提供更多选择有益。
💡 OpenAI 悄悄更新 ChatGPT,Plus / Pro 订阅用户可享全局对话内容记忆功能
IT之家 | 阅读原文

4月11日,OpenAI悄悄为ChatGPT更新,订阅Plus和Pro级别的用户可使用“改进的上下文记忆功能”。OpenAI首席执行官Sam Altman称,ChatGPT能“参考用户过去所有对话”,提供个性化体验。它可掌握用户偏好兴趣来定制回复,用户也能通过提示词告知。隐私方面,用户可在设置中对记忆内容删改或关闭该功能。
💡 Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta
新智元 | 阅读原文

xAI 上线 Grok 3 API,推出4种模型及4种定价套餐。Grok 与 Gemini 日活超 50 万且差距小。谷歌推新套餐,部分对个人开发者免费。Anthropic 推出 100 美元 Max 套餐。Meta 开源 Llama 3 成本低,Llama 4 Maverick 性价比高。Grok 3 适用于企业,Grok 3 MINI 用于简单任务,不同模式在响应速度和成本上有别,开发者可按需选择。
💡 AI医学影像通用大模型硬核突围!重压之下打破进口垄断,引领国产替代
新智元 | 阅读原文

在中美关税交锋、全球物流成本飙涨等多重压力下,国产医疗三剑客联影、迈瑞、德适积极突围。联影董事长提出核心技术攻坚铁律,推出领先设备;迈瑞以「设备+IT+AI」为战略,优化产品、构建自主生产体系、深耕海外市场;德适选择差异化竞争,切入AI医学影像领域,构建生态。中国医疗企业加速国产替代,有望迈向「价值创造」。
💡 谷歌推出 Vertex AI Media Studio 文生视频套件:自动化包办画面渲染、旁白、配乐等
IT之家 | 阅读原文

4月10日谷歌推出Vertex AI Media Studio平台。该套件整合四大核心模型,无需编码或剪辑经验,可自动化包办画面渲染、旁白、配乐等,改变传统视频制作流程。技术架构模块化,各模型分工明确,依托Vertex AI平台,支持Gemini模型。此工具简化创作,却引发关于真实性、人类创意及AI使用责任的讨论 。
💡 广东发布中小学 AI 教育方案:原则上 1-4 年级每学年不少于 6 课时
IT之家 | 阅读原文

4月10日,广东发布推进中小学人工智能教育“两素养1纲要”方案。明确小学1 - 4年级每学年不少于6课时,5 - 6年级每学年不少于10课时,初中7 - 8年级不少于每两周1课时,高中在高一或高二不少于每两周一课时。“2+1”方案含两大素养框架和一个课程纲要,还在制定AI工具与国家平台融合应用指南。近期,北京也提出从2025年秋季学期起,全市中小学开展人工智能通识教育,每学年不少于8课时。
💡 王小川发布百川智能两周年全员信:强调专注医学方向并减少多余动作
IT之家 | 阅读原文

4月10日,百川智能创始人王小川在公司两周年发布全员信。回顾成就,如预见的技术与产业方向渐成现实,研发与落地可圈可点,开源模型被广泛用,推出多个医疗成果 。也指出不足,如战线长、聚焦不够、目标有偏差。未来将在百小应、AI 儿科、AI 全科和精准医疗 发力,减少多余动作,简化组织,重申为生命建模型、为人类造医生的使命。此前百川智能To B团队有变动。
💡 百度:文心大模型 4.5 Turbo 4 月 25 日见
IT之家 | 阅读原文

IT之家4月10日消息,百度文心大模型 4.5 Turbo将于4月25日的Create大会亮相,Create 2025百度AI开发者大会当日在武汉体育中心举办,设有六大分会场等丰富活动,现场嘉宾有李彦宏等。3月16日百度已发布文心大模型 4.5和X1 ,4.5已上线千帆平台,X1即将上线。4.5是百度首个原生多模态大模型,多项测试优于GPT4.5 ,API调用价仅为其1% ;X1对标DeepSeek-R1 ,支持多模态等,API调用价约为R1一半。