本周人工智能大事件:基米万亿模型“诞生”,
时间:2025-11-10 10:11 作者:bet356在线官方网站

1、强大工具——1万亿参数 Kimi“亮剑”,能做事也能做事 Do the News:月之暗面(Moonshot AI)宣布推出 Kimi K2 思维,这是一个从头开始开发的开源推理模型,用于开发强大的 AI 代理。混合专家(MOE)模型基于 Kimi K2 构建,总参数量达 1 万亿个,推理过程中的活跃参数达 320 亿个,支持的最长上下文可达 256,000 个单词。在数学、编程和智能体基准测试中,Kimi K2 Thinking 的表现与 GPT-5 和 Claude 4.5 Thinking 相当:在人文学科期末考试 (HLE) 测试中得分 44.9%,在 SWE-Bench 验证集测试中得分 71.3%,在 Browsecomp(搜索搜索)测试中得分 60.2%。该模型不仅具有良好的整体写作、编码和推理能力,而且在代理任务和工具调用方面也有更好的表现。它可以在无需人工干预的情况下连续调用该工具200到300次,解决通过数百个连贯推理步骤解决复杂问题。 Kimi K2的思维采用有意识训练技术(QAT)来保证其版本的数量不会降低输出的质量。鉴于基准测试结果基于 INT4 精度,该模型的性能尤其值得注意。这可能是自Deepseek R1发布以来中国公司推出的最重要的AI模型。这再次表明,中国的AI实验室正在缩小与美国顶尖AI实验室的差距。芮平:中国人工智能此时的考验不是复制,而是再现知事做事。 2、技术与产品发布——从“计算地球”到“改变人类面孔”,各大厂商大显身手停不下来 1、新闻:艾伦人工智能研究所(AI2)推出开源端到端“地球智能”平台Olmoearth,旨在利用对地观测数据帮助人们认识地球深入了解地球的运行机制。包括: Olmoearth基础模型:基于对地观测数据训练的小型AI模型,参数范围为140万到3亿,用于执行场景识别或语义隔离等地理空间相关任务; Olmoearth Studio:数据集建模和微调功能; Olmoearth Run:地球建模流程引擎; Olmoearth 项目:实用地球智能模型。芮点评:未来AI会统计世界和地球,中间会统计空气。 2. 新闻:微软已将自主开发的 Vincent 图像模型 Mai-image-1 集成到 Bing 图像创建器和 Copilot 中。该模型可以快速生成食物、自然和现实世界场景的高质量图像,使微软不再依赖openai的图像生成技术。批判性评论:微软终于不再依赖OpenAi画图,决定自己做足够的食物和衣服。 3.新闻:我ituan龙猫团队发布了开源龙猫Flash Omni的全模态模型,采用MOE架构,总参数量5600亿,激活量270亿。技术报告显示,该模型在多模态基准测试中达到了SOTA水平。 RUI点评:美团这次不会送外卖,而是会送模型。 4. 新闻:中国电动汽车公司小鹏汽车推出铁汉机器人。该公司表示,该机器人“最像人类”,拥有灵活的皮肤和仿生肌肉。人形骨骼、肌肉和皮肤的结构使这款机器人成为迄今为止最接近人类的机器人,甚至引发了“恐怖谷效应”和“科幻小说成真”的讨论。小鹏汽车同时发布了大型VLA 2.0模型,这是一种体现人工智能的视觉语言模型,适用于自动驾驶汽车和人工智能机器人。
芮平:以前总有人说小鹏汽车在模仿特斯拉,但实际上是时间还是相反。 5. 新闻:Cognition 发布 Windsurf 代码图。该工具由 SWE-1.5 和 Sonnet 4.5 提供支持。它可以帮助开发人员理解复杂的代码结构,例如为代码库构建的 Notebook LM。批判评论:认知拿下《代码生活地图》,程序员再也不会迷路了。 6. 新闻:Maya研究团队发布Maya1开源语音生成模型,拥有30亿个参数。该文本转语音模型在质量基准中攀升至开源加权人工智能模型中的第二位,并在全球模型中排名第 20 位。 HuggingFace 平台现已提供演示和模型权重。 RUI点评:AI不再只会说话,还能“好好说话” 7、新闻:谷歌在Gemini API中引入了g文件搜索工具(file search tool),提供端到端的检索增强生成(RAG)功能,为开发者简化了复杂的rag流程。它支持内置引文、多种文件格式,以及强大的语义向量搜索。此外,Google的无代码构建工具覆盖全球160多个国家和地区。芮平:让开发者一键解决抹布头痛问题。 8.新闻:Mozilla.ai发布了开源接口any-llm 1.0,它允许开发人员将任何云端和本地模型连接到AI流程。任何法学硕士都通过统一的 API 将项目逻辑与提供者模型解耦,允许开发人员自由迁移模型,而无需重写集成代码。芮平:想带谁就选谁,实现模特自由不是梦。 9.新闻:Higgsfield发布了Recast功能,该功能允许用户将任何视频中的角色替换为另一个角色。点评:人工智能让“换主演不换戏”成为影视行业新常态。 10.消息:Sora现已登陆Android平台,让SORA 2代的先进功能惠及更多用户。然而,目前Android用户仍然需要邀请码才能使用Sora生成功能,并且仅在某些国家和地区可用。评论:Sora 在 Android 上直播,但要求你有邀请码。 11. 消息:TheGoogle 新一代 Nano Banana 2 最早可能在下周发布。 Nano Banana之前的版本在SOTA级别的图像编辑方面广受欢迎,其升级版本有望显着提高AI辅助创意工作流程的效率。点评:AI画圈传奇即将有续集。 3、AI研究资讯——谷歌认为地球电费昂贵,准备玩“天空算力”的消息:作为天基AI基础设施项目Suncatcher的一部分,谷歌将在2027年发射两颗由众多卫星创建的卫星任务。谷歌预计,未来几十年,天基数据中心可能比地面数据中心更高效基于数据中心,因为轨道上的太阳能电池板比地球好八倍。 RUIPING:节省的电力足以支付卫星发射的费用吗? 4. AI业务与政策——OpenAi花了很多钱,苹果付出代价 1.消息:据报道,苹果正在与谷歌达成协议,每年支付10亿美元,在下一代Siri语音助手中使用谷歌拥有1.2万亿参数的AI模型。这意味着苹果再次依赖外部技术来实现 Siri 的 AI 功能。许久没有更新的Siri,显然让苹果在AI竞争中落后了。点评:Siri 终于变得更聪明了,但它的大脑属于 Google。 2、新闻:Openai发布《青少年安全蓝图》,旨在指导人工智能产品和政策如何保护青少年安全,如何更好地赋能青少年。该蓝图强调适合年龄的设计、有效的安全机制以及持续的研究和电子技术估价。 Openai表示,该公司正在积极为其产品部署家长控制和年龄预测系统等保护机制,而不是简单地等待人工智能如何保护青少年的法规。瑞平:Openai想要证明我们是认真照顾下一代的。 3.消息:Openai与亚马逊宣布达成380亿美元协议。 OpenAI 将在 AWS 基础设施上运行模型,以访问数十万个 NVIDIA 芯片。此举进一步提升了OpenAi的算力和云部署能力,更好地支持ChATGPT的推理和预测。评论:380 亿美元用于喂养 chatgpt。 4.新闻:Openai宣布全球有100万家企业直接使用该公司的服务。公告称,统计范围包括所有主动付费商业使用的组织,以及通过开发者平台直接消费模型的企业。该公司此前披露9月初,与Chatgpt合作的Chatgpt Edu企业版和校园版用户数已突破百万。芮平:看来大家都已经尝到了用AI来工作的好处。 5.新闻:NVIDIA首席执行官黄仁勋周三在接受采访时表示,“中国将赢得人工智能竞赛”,理由是更有利的监管环境和更低的能源成本。这被认为是黄仁勋迄今为止对中美人工智能竞争的“最坦白的表态”。突发评论:老黄说的是实话。 6、新闻:黄仁勋本周末再次拜访台积电,前往芯片生产线,罕见出席台积电员工大会。这也是黄仁勋近三个月来第三次到访台积电。对于此行的目的,黄仁勋表示,公司最先进的Blackwell芯片面临“非常强劲的需求”,因此对台积电晶圆的需求也在增长。他说:“NVIDIA 生产 GPU,我们也生产 CPU,净工作设备、开关等,所以有很多与Blackwell相关的芯片。而且公司也在致力于开发下一代红宝石芯片。”台积电CEO魏哲家直言“黄仁勋想要更多芯片”,但被问到具体数量时,魏哲家笑称“这是秘密!”锐评:就是为了赶出货。7、新闻:首届AI大模型实时投资大赛“阿尔法竞技场”已经结束。时隔17天,阿里巴巴同益千文Qwen以超过20%的回报率夺冠,中国两款机型Qwen和Deepseek成为唯一盈利模式,但美国前四名的机型却亏损超过60%。相比之下,Shopify 正在积极迎合人工智能代理在电商购物中的新角色。 Shopify表示,今年1月以来,AI流量有所增加编辑7次,AI下单量增长11倍。 Shopify 已经与 Extinction 和 Microsoft 合作打造购物体验,并与 OpenAi 深度集成 Chatgpt。芮平:亚马逊不允许人工智能购物,因为它不增加会员数量。 9. 新闻:Anthropic宣布在巴黎和慕尼黑开设新办事处,加速全球业务扩张。欧洲是Anthropic增长最快的地区,Claude AI欧洲营收同比增长9倍以上。 Anthropic的目标是到2026年年化pau经常性收入达到200亿至260亿美元。 瑞平:看来你们真的在欧洲赚钱了。 10 新闻:美联社宣布推出 AP Intelligence,这是一种结构化数据产品,可利用人工智能和数据分析来转换经过验证的新闻报道行业数据集和信息源。芮平:老牌媒体开始卖数据,“真相”被正式包装成API格式。 11消息:面对大型科技公司的压力以及与美国就贸易问题进行的谈判,欧盟委员会正在考虑暂停《人工智能法案》的部分条款。尽管该法案将于2024年8月正式出台,但部分条款的实施可能会延迟。评论:欧洲人工智能监管也大张旗鼓,但收效甚微。 5.人工智能观点和文章——卡戴珊未能通过测试并指责人工智能。 “Coder”编程高度依赖“感觉” 1、新闻:美国网红 Kim Kardashian 在接受《名利场》采访时表示,Chatgpt 对她来说是“亦敌亦友”。他表示,他对美国律师考试感到失望,因为他使用 ChatGPT 来获取法律建议,并指责该模型的“幻觉”产生的错误信息导致了失分。这再次引起了公众对大规模语言模型产生错误答案并造成现实世界后果的担忧。芮平:你不能责怪人工智能或者考试不及格,还是要从自己身上找原因。 2.新闻:柯林斯词典2025年热词是“vibe编码”,意思是使用自然语言信号让AI编写代码或构建应用程序。人工智能不仅改变了世界,也改变了语言本身。
芮点评:敲代码不再需要编程,而是严重依赖“感觉”来问AI问题。 (辰辰)