vLLM v0.20.0 正式发布
本次vLLM发布了v0.20.0版本,主要更新包括将默认CUDA版本切换到13.0,更新了CUDA架构列表,带来了对最新NVIDIA GPU的原生支持。作为当前最流行的开源大模型推理引擎,vLLM持续优化推理性能,支持更多新模型架构,本次更新进一步巩固了其在开源AI生态中的地位。该版本包含社区197位贡献者的448次提交,持续推动项目迭代。
阅读原文 →本次vLLM发布了v0.20.0版本,主要更新包括将默认CUDA版本切换到13.0,更新了CUDA架构列表,带来了对最新NVIDIA GPU的原生支持。作为当前最流行的开源大模型推理引擎,vLLM持续优化推理性能,支持更多新模型架构,本次更新进一步巩固了其在开源AI生态中的地位。该版本包含社区197位贡献者的448次提交,持续推动项目迭代。
阅读原文 →据路透社报道,SpaceX计划自主制造GPU,以满足其日益增长的AI野心,同时应对芯片供应成本问题。有消息称,马斯克正将SpaceX的重心从火星转移到AI,为IPO做准备,这引发了市场对SpaceX与特斯拉潜在竞争的讨论。目前SpaceX在AI领域动作频频,此前已经达成了以600亿美元收购AI编码初创公司Cursor的意向协议。
阅读原文 →三星芯片部门超过3万名工人举行集会,要求分享AI热潮带来的利润,提出了分得营业利润15%的诉求。随着AI产业爆发式增长,三星作为全球主要芯片供应商获利丰厚,但员工认为收益分配未能体现他们的贡献。这次罢工凸显了AI产业发展带来的利益分配矛盾,也反映出科技行业劳工对AI红利分享的诉求日益增长。
阅读原文 →天文学家开始大规模使用GPU加速星系搜索,在广袤的星系图像中寻找特殊天体,这进一步加剧了全球GPU供应紧张。AI技术帮助天文学家快速处理海量天文观测数据,发现以前难以识别的星系和天体现象,但对计算资源的需求也水涨船高。GPU短缺已经从AI训练蔓延到科研领域,反映出AI对各行各业计算需求的深刻影响。
阅读原文 →中国科技巨头腾讯 unveiled了其首个旗舰AI模型,由前OpenAI研究员掌舵。这标志着腾讯在AI大模型领域的重要布局,也反映出中国科技公司加速AI自研的趋势。目前中国开源模型正在快速普及,腾讯作为互联网巨头入场将进一步改变国内AI产业格局,推动AI在更多应用场景落地。
阅读原文 →英国《金融时报》调查发现,高收入人群在采用AI技术方面遥遥领先,这种差距正在加深职场不平等。高收入群体更有机会使用AI工具提升工作效率,而低收入岗位AI渗透率较低,这进一步放大了收入差距。研究显示,不少初创企业在AI上的投入甚至超过员工薪资总额,AI正在重塑职场权力结构。
阅读原文 →索尼开发的AI乒乓球机器人Ace通过强化学习训练,首次能够在正式比赛中击败顶尖人类选手。该机器人配备多个摄像头快速捕捉球路,通过AI实时计算击球角度和力度,在与顶级选手的对抗中已经能赢下部分对局。这展示了AI在动态物理对抗场景中的最新进展,证明强化学习能够让机器人在复杂实时运动中达到人类顶级水平。
阅读原文 →美国参议员伊丽莎白·沃伦警告称,AI行业当前的大规模支出和借贷 practices 正在制造一个巨大的泡沫,其 parallels 与2008年金融危机前的情况惊人相似。她指出"我看到泡沫的时候就认得出来",认为AI行业投资过热,大量资金涌入但缺乏可持续商业模式,可能最终引发金融危机。呼吁国会介入监管,防止重蹈互联网泡沫和次贷危机的覆辙。
阅读原文 →在Google Cloud Next大会上,谷歌发布了新一代TPU AI芯片,宣称比上一代更快更便宜,直接对标NVIDIA最新GB300产品。谷歌最新TPU在性能和成本上都有显著提升,但谷歌仍然表示会继续支持NVIDIA GPU,保持云市场的灵活性。这标志着谷歌在AI芯片赛道持续发力,试图打破NVIDIA的垄断地位,为云客户提供更多选择。
阅读原文 →Cursor原本计划进行20亿美元融资,SpaceX提出了10亿美元"合作费"加600亿美元收购选项,抢先一步获得了这家AI编码平台。Cursor专注于AI辅助编程,在开发者中迅速走红,被认为有可能挑战GitHub Copilot的市场地位。Elon Musk希望通过收购增强xAI在编码领域的竞争力,与OpenAI和Anthropic直接竞争。
阅读原文 →OpenAI面向商业客户推出了Workspace Agents功能,允许团队创建自定义云端机器人自动完成业务任务。支持自动收集产品反馈并发送Slack报告,撰写后续邮件等自动化工作流,仅对Business、Enterprise等高级计划开放。这是OpenAI在AI代理方向的重要布局,借鉴了OpenClaw等Agent工具的成功经验,将Agent能力融入企业工作流。
阅读原文 →Meta开始在员工电脑上安装工具,记录鼠标移动、点击和键盘输入,用于训练AI模型,引发员工强烈反对。公司表示这些数据仅用于AI训练,不会用于绩效评估,但隐私问题仍然引发广泛担忧。Meta希望通过收集真实人类交互数据,让AI模型更好地学习如何在电脑上完成操作,提升AI代理的能力。
阅读原文 →Anthropic专为 cybersecurity设计的高端模型Mythos被一小撮未授权用户获取,据称是通过第三方承包商的权限漏洞。Bloomberg报道称,私有论坛用户利用常见的互联网侦查技巧获取了访问权限,而这个模型被Anthropic自身认为太危险不适合完全发布。事件再次引发了关于高端AI模型安全分发的讨论,如何防止未授权使用成为行业难题。
阅读原文 →Google为企业版Chrome带来了Gemini驱动的自动浏览能力,允许AI自动完成研究、数据录入等网页任务。这项名为auto browse的功能让AI能够在浏览器中自主操作,帮助员工完成重复性的网页工作,大幅提升办公效率。这是Google在Chrome中深度集成AI能力的重要一步,将AI能力直接带到用户日常浏览环境中。
阅读原文 →Google将在企业版Gmail中推出AI Overviews功能,能够跨多封邮件提取要点生成即时摘要。用户无需逐一打开邮件就能了解整串邮件沟通的核心内容,大幅提升邮件处理效率。该功能基于Gemini模型,是Google在Workspace中全面AI化的一部分,在Cloud Next大会上集中发布了一系列AI增强功能。
阅读原文 →Google发布了Gemini Enterprise Agent Platform,采取了与众不同的定位,主要面向IT和技术用户,而非直接面向业务人员。平台提供了更底层的工具让企业构建自己的AI代理,强调定制化和可控性,这与其他厂商追求低代码无代码的方向形成对比。分析认为,这种定位更符合企业IT部门的实际需求,允许他们根据自身安全合规要求构建代理系统。
阅读原文 →OpenAI与印度IT服务巨头Infosys达成合作,将OpenAI的AI工具带给更多企业客户。集成将主要用于帮助客户现代化软件开发,自动化工作流程,部署AI系统,初始重点在软件工程、遗留系统现代化和DevOps领域。这是OpenAI拓展企业市场的重要一步,通过成熟IT服务商渠道触达更多传统行业客户。
阅读原文 →发表在《自然-能源》上的最新研究指出,即使核聚变发电实现商业化,成本下降速度也可能远慢于预期,因为聚变电站体积大、复杂度高,经验率估计只有2%-8%,远低于太阳能电池的23%。这意味着即使大规模部署,电价也很难快速下降到可竞争水平,研究作者质疑当前公共资金对聚变的投入规模是否合理。但也有专家指出,历史上太阳能也曾被低估成本下降速度,现在判断为时尚早。
阅读原文 →AI药物发现初创公司10x Science完成了480万美元种子轮融资,专注于帮助药企从AI生成的海量潜在分子中筛选出真正有价值的候选药物。AI技术能够快速生成数百万个潜在分子结构,但其中绝大多数没有实际成药价值,公司希望通过更精准的筛选技术提高药物研发成功率。AI让药物发现的准入门槛降低,但后续验证成本仍然很高,精准筛选成为关键痛点。
阅读原文 →除了前文提到的3万人集会,三星芯片部门工人的诉求已经引发韩国社会广泛讨论,工会认为AI驱动的芯片需求暴发给公司带来巨额利润,但一线工人并没有享受到相应收益,要求分配15%的营业利润作为特别奖金。这场争端可能成为全球科技行业AI红利分配的标志性事件,影响其他企业员工诉求。
阅读原文 →这是一个有趣的开源项目,旨在创建一个自动化的机器学习工程师,能够阅读论文、训练模型并部署 ML 模型。项目由 HuggingFace 社区维护,采用 Python 开发,今日新增 530 个 Star,目前总 Star 数已达 1,982。该项目探索了 AI 自动化研发的可能性,让 AI 辅助机器学习开发流程,对于研究 AI 辅助工程开发具有重要参考价值。
阅读原文 →这是一个为 Claude Code 提供代码搜索 MCP 服务的项目,可以将整个代码库作为上下文提供给编码代理,提升 AI 编码体验。项目采用 TypeScript 开发,今日新增 1,023 个 Star,总 Star 数已达 8,126,增长速度非常迅猛。该工具解决了 AI 编码代理上下文窗口有限的痛点,能够帮助开发者更高效地在大型代码库中进行开发,是 AI 开发工具领域的热门新晋项目。
阅读原文 →这是一个集成化的黑客工具包,提供了一站式的渗透测试功能。项目采用 Python 开发,今日新增 1,366 个 Star,总 Star 数已经达到 60,477,受欢迎程度非常高。工具集成了各类安全测试工具,方便安全研究人员和渗透测试人员使用,是网络安全领域非常受欢迎的开源项目,持续保持较高的活跃度。
阅读原文 →该项目专注于 AI 编码代理的上下文窗口优化,能够对工具输出进行沙箱处理,减少 98% 的无效上下文占用,支持 12 种不同平台。项目采用 TypeScript 开发,今日新增 302 个 Star,总 Star 数已达 9,131。随着 AI 编码代理的普及,上下文窗口优化成为重要需求,这个项目刚好解决了行业痛点,具有很高的实用价值。
阅读原文 →这是一个为 Claude Code 和 AI 代理提供营销技能的项目,包含 CRO、文案写作、SEO、分析和增长工程等内容。项目采用 JavaScript 开发,今日新增 312 个 Star,总 Star 数达到 23,329。该项目让 AI 代理能够具备专业营销能力,扩展了 AI 代理的应用场景,受到市场推广领域开发者的欢迎。
阅读原文 →这是一个统一的元数据平台,用于数据发现、数据可观测性和数据治理,由中央元数据存储库驱动,支持深入列级血统分析和无缝团队协作。项目采用 TypeScript 开发,今日新增 771 个 Star,总 Star 数达到 12,705。随着数据治理越来越受到企业重视,这个开源项目为企业提供了完整的元数据管理解决方案,受到数据领域开发者的关注。
阅读原文 →该项目提供了在终端、VSCode 扩展或 Discord 中免费使用 Claude Code 的方法,类似于 openclaw 的使用方式。项目采用 Python 开发,今日新增 181 个 Star,总 Star 数达到 4,371。对于想要免费体验 Claude Code 功能的开发者来说,这个项目提供了可行方案,因此受到广泛关注。
阅读原文 →这是 Chip Huyen 所著《AI Engineering》一书的配套资源库,包含了书中的支持材料,目前仍在更新中。项目采用 Jupyter Notebook 开发,今日新增 214 个 Star,总 Star 数达到 15,054。AI 工程是当前热门领域,这本书由知名专家撰写,配套资源对学习 AI 工程非常有帮助,因此受到 AI 学习者的欢迎。
阅读原文 →这是微软推出的 AI 代理入门课程,包含 12 节课,帮助开发者从零开始构建 AI 代理。项目采用 Jupyter Notebook 开发,今日新增 177 个 Star,总 Star 数已经达到 58,536,是非常受欢迎的开源学习项目。随着 AI 代理技术的兴起,越来越多开发者想要入门这个领域,微软推出的这个免费课程自然受到广泛关注。
阅读原文 →这是一个可以在 IDE 中运行的自主编码代理,能够在开发者授权下创建/编辑文件、执行命令、使用浏览器等操作。项目采用 TypeScript 开发,今日新增 103 个 Star,总 Star 数达到 60,690,是目前最受欢迎的自主编码代理项目之一。该项目将 AI 编码能力直接集成到开发环境中,提升了开发效率,受到广大开发者的喜爱。
阅读原文 →