⭐ 今日热点
💡 初探 OpenAI GPT-4.1 性能:AI 编程能力大增,但谷歌 Gemini 依然称王
IT之家 | 阅读原文

4月15日科技媒体报道,OpenAI发布GPT-4.1系列模型,编程能力远超GPT-4o 及GPT-4o mini,如在SWE-bench Verified跑分中,GPT-4.1得分达54.6% 。但多位专家测试显示,与谷歌Gemini系列相比,GPT-4.1在错误率、成本、性价比、编码专项测试等方面显露劣势,如Gemini 2.0 Flash错误率6.67%,GPT-4.1高达16.67%,成本是其10倍以上。不过,GPT-4.1虽是非推理模型,编码能力仍属行业顶尖。
🌟 技术突破
💡 支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了
新智元 | 阅读原文

2025年,魔搭ModelScope上线国内最大MCP中文社区「MCP广场」,近1500款MCP服务覆盖多领域,支付宝、MiniMax明星服务首发。MCP能简化AI开发,如降低配置次数,实现与供应商解耦。其让智能体能力扩展,应用场景拓宽。魔搭还推出MCP Bench评估MCP服务。虽MCP有局限,但正重塑AI生态,开启AI作为软件“一等用户”新时代。
💡 英伟达含量为零:华为密集模型盘古 Ultra 性能比肩 DeepSeek-R1,纯昇腾集群训练
IT之家 | 阅读原文

华为用纯昇腾集群训练出盘古Ultra,参数量135B。在推理任务中与DeepSeek - R1竞争激烈,在多类任务上性能优异,超越诸多强大模型。技术上,采用“三明治”层归一化架构、TinyInit初始化策略等;Tokenizer优化得153376个token平衡词表。训练分三阶段,用8192张昇腾NPU集群,多种并行策略及优化技术,实现52%以上算力利用率 。
💫 企业动态
💡 消息称苹果 watchOS 12 将引入 Apple Intelligence 功能,依赖 iPhone 运行模型
IT之家 | 阅读原文

彭博社记者马克・古尔曼透露,苹果即将发布的软件更新中,iPadOS 19 将让 iPad 更接近 Mac 体验,watchOS 12 将引入 Apple Intelligence 功能,且依赖 iPhone 运行模型。这一策略因 Apple Watch 硬件限制,并非意外,类似方法在 watchOS 11 已有采用。虽未透露具体功能,但 Apple Intelligence 将成 Apple Watch “官方支持” 功能,watchOS 12 还会引入 iOS 19 部分新界面元素,整体界面无重大调整 。
💡 OpenAI 的 GPT - 4.1 无安全报告,AI 安全透明度再遭质疑
IT之家 | 阅读原文

4月16日OpenAI推出GPT-4.1,却未附带安全报告,截至次日上午仍未发布且似无计划。发言人表示其非前沿模型所以不发。此前已有一些实验室降低报告标准。OpenAI过去也曾因安全报告问题受批评。前安全研究员称安全报告自愿发布,但OpenAI曾承诺增加透明度。现、前员工对其安全实践担忧。虽GPT-4.1性能有进步,但有观点认为性能提升让安全报告更重要,且不少实验室抵制安全报告入法 。
💡 谷歌 Veo 2 视频生成模型入驻 Gemini,用户可创建 8 秒 720p 视频
IT之家 | 阅读原文

4月16日谷歌宣布将Veo 2视频生成模型带给Gemini Advanced订阅用户,用户能创建8秒720p视频,可分享或下载。谷歌还在Whisk中整合Veo 2。目前应用场景较基础,谷歌DeepMind首席执行官德米斯・哈萨比斯称计划将Gemini AI与Veo结合。但Veo 2引发担忧,2024年研究估计到2026年AI将扰乱美国超10万个影视动画岗位 。
💡 OpenAI 收购 Context.ai 团队,AI 评估能力再升级
IT之家 | 阅读原文

4月16日消息,OpenAI 宣布收购 Context.ai 团队。该团队由前谷歌员工创立于 2023 年,曾获 350 万美元种子资金,专长于评估和分析 AI 模型。其联合创始人将加入 OpenAI 研发评估工具。Context.ai 计划关闭现有产品。随着 AI 模型变复杂,评估指标愈发关键,此次收购正值行业竞争加剧,OpenAI 希望借此提升评估能力,拉开与对手差距 。
💡 直面 OpenAI,Anthropic 正筹备“最快本月”推出语音交互功能
IT之家 | 阅读原文

彭博社4月16日报道,Anthropic正筹备在Claude AI聊天机器人中推出“语音模式”,最快本月上线,将与OpenAI竞争。其将提供三种英文语音。上月首席产品官就提到有语音功能原型,此前应用分析师也发现相关线索。Anthropic由前OpenAI员工创办,近日推出高价订阅方案和科研AI工具,还探索新收入渠道,如针对教育领域项目。
💡 OpenAI 更新《准备框架》:聚焦识别和缓解具体风险、细化能力分类,更好应对 AI 安全挑战
IT之家 | 阅读原文

4月16日,OpenAI发布新版《准备框架》以应对AI安全挑战。该框架更聚焦识别和缓解具体风险,强化风险最小化要求。它为高风险能力设优先级标准,细化能力分类,明确能力等级。其安全顾问小组审查安全措施,引入可扩展评估机制。若其他开发者发布高风险系统,OpenAI会视情况调整要求,确保不增整体风险 。
💡 挑战马斯克的 X:OpenAI 被曝正研发 ChatGPT 社交平台,AI 驱动内容分享
IT之家 | 阅读原文

4月15日科技媒体报道,OpenAI正开发类似X的社交网络,处于早期阶段,内部原型以ChatGPT图像生成功能为核心并融合社交信息流。首席执行官山姆・奥尔特曼私下征求意见,尚不清楚该社交网络将独立发布还是整合进ChatGPT。此举或加剧与马斯克竞争,此前马斯克欲收购OpenAI遭拒,奥尔特曼还戏称愿收购X。此外Meta也在为AI助手开发独立应用。OpenAI社交原型旨在用AI助用户分享优质内容,不过该项目能否上线存疑 。
💡 OpenAI ChatGPT 上线图库功能,更轻松管理 AI 生成图片
IT之家 | 阅读原文

4月16日,OpenAI在X平台宣布为ChatGPT上线Image Library图库功能,方便用户管理和查看AI生成图像。此功能面向Free、Plus和Pro用户,覆盖移动端和网页端。演示视频展示其使用方式,点击侧边栏“Library”板块可进入展示界面,底部有悬浮按钮生成新图像。iOS应用已上线,网页版未完全推出,对常生成图片的用户很实用 。
💡 我国首批人形机器人系列国家标准正式立项,涉环境感知、运动控制等技术要求
IT之家 | 阅读原文

2025年4月15日消息,我国首批人形机器人系列国家标准正式立项,涉及环境感知等多项技术要求。人形机器人产业发展快,标准化建设意义重大。北京经济技术开发区企业深度参与,北京人形机器人创新中心是主要贡献方,牵头编写多项技术要求。优必选主导牵头作业操作技术要求,参与近40项国家及行业标准。截至2024年12月,优必选持有2680项授权专利,人形机器人有效专利全球第一。
💡 迅雷功能插件升级:一键完成大模型批量下载
IT之家 | 阅读原文

4月15日消息,迅雷上线新版本插件,针对大模型下载场景优化。用户下载迅雷客户端并在浏览器安装插件,就能更快更方便地批量下载大模型文件。创建任务时会自动创建对应文件夹,下载后文件都在该文件夹。此插件整合P2SP与云下载加速技术,能跑满本地带宽,比传统逐个手动下载更便捷、速度更快、更省时 。
💡 GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的
新智元 | 阅读原文

GPT-4.1 发布,号称将淘汰 GPT-4.5,具备更强编码性能等优势。实测中编码表现惊艳,但综合实力仍逊于 Gemini 2.5 Pro 和 Claude 3.7 Sonnet。OpenAI 正将 API 和 ChatGPT 分离,虽其周活用户破 19 亿,但想在 API 业务突破谷歌优势尚需努力。新模型可能从 GPT-4.5 蒸馏而来,对普通用户,产品化体验更重要,OpenAI 有先发优势,但实现愿景仍任重道远。
💡 快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型
IT之家 | 阅读原文

4月15日,快手举行“灵感成真”可灵AI 2.0模型发布会,发布可灵2.0视频生成模型及可图2.0图像生成模型。可灵2.0在动态质量等维度领先,可图2.0在指令遵循等方面提升。盖坤透露,自去年6月发布,可灵AI已超20次迭代,全球用户超2200万,过去10个月,月活用户量增长25倍,累计生成超1.68亿视频、3.44亿图片。发布会仍在进行,更多细节待更新 。
💡 黄仁勋5000亿豪赌:AI超算首次Made in USA!
新智元 | 阅读原文

这些新闻涵盖多领域。技术上,英伟达将在美国制造最强AI芯片,微软AI模型能生成新材料等;企业动态有百炼智能成立新公司,国芯科技与广汽合作等;行业观点如李彦宏称自动驾驶比人类司机安全十倍,黄仁勋提到DeepSeek激发推理热情。此外还有中美贸易、政治相关消息,如特朗普对芯片等的举措,以及各类社会趣闻等。
💡 AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
新智元 | 阅读原文

这些新闻涵盖多领域。技术突破如GPT-4.1推新模型,华为盘古Ultra发布等;企业动态有智谱开源6款模型,小鹏汽车启动自驾基模研发等;行业观点涉及黄仁勋投资AI超算等。此外还包含国际局势、社会热点等内容,如美对中战略部署转变、多地民生事件等。
💡 《流浪地球 3》剧组用上专属 AI 问答应用 WEi:基于 DeepSeek,内部资料高效检索
IT之家 | 阅读原文

4月15日,《流浪地球 3》正式开机,导演郭帆和主演吴京、沈腾参加,影片将于2027年2月6日上映。开机仪式上,官方介绍了自主研发的专属AI问答应用WEi 。它基于DeepSeek R1大语言模型开发,整合多元知识库资源,能为剧组成员在创作、协作等场景提供高效检索通道。
💡 AI 应用可一键调用支付宝,国内首个支付 MCP 服务发布
IT之家 | 阅读原文

4月15日,支付宝联合魔搭社区推出国内首个“支付 MCP Server”服务,AI 开发者能用自然语言接入支付宝支付服务。MCP 是大模型连接软件应用的标准协议,此前大模型调用功能需程序员写代码对接,现在符合 MCP 标准工具即插即用,拓宽应用边界。该服务有 MCP 协议原生支持等四个特征,在多个平台首发上线,助力 AI 支付发展 。