Anthropic发布新一代Claude 4 AI模型,支持多步推理能力
Anthropic发布新一代Claude 4 AI模型,支持多步推理能力在周四举行的首届开发者大会上,Anthropic推出了两款新的AI模型,该初创公司声称这些模型在行业基准测试中表现优异,跻身业界顶尖行列。
Claude Opus 4和Claude Sonnet 4作为Anthropic全新Claude 4系列模型的成员,据该公司介绍,能够分析大型数据集、执行长期任务并采取复杂行动。两款模型都经过编程任务的特别调优,使其非常适合编写和编辑代码。
付费用户和免费聊天机器人应用的用户都能获得Sonnet 4的访问权限,但只有付费用户能够使用Opus 4。在Anthropic的API定价方面,通过Amazon的Bedrock平台和Google的Vertex AI,Opus 4的价格为每百万token 15/75美元(输入/输出),Sonnet 4为每百万token 3/15美元(输入/输出)。
Anthropic的Claude 4模型发布之际,该公司正寻求大幅增长收入。据报道,这家由前技术人员创立的公司目标是在2027年实现120亿美元的收入,而 ...
OpenAI Codex 加入Agent编程工具新阵营
OpenAI Codex 加入Agent编程工具新阵营上周五,OpenAI推出了一款名为Codex的新型编程系统,该系统能够通过自然语言命令执行复杂的编程任务。Codex标志着OpenAI正式进军正在形成的代理编程工具新阵营。
从GitHub早期的Copilot到当代的Cursor和Windsurf等工具,大多数AI编程助手都是作为一种极其智能的自动补全形式存在。这些工具通常集成在开发环境中,用户直接与AI生成的代码交互。而简单地分配任务并在任务完成时返回查看结果的可能性,在过去很大程度上是无法实现的。
但是,以Devin、SWE-Agent、OpenHands以及上述OpenAI Codex为代表的新型代理编程工具,旨在无需用户查看代码就能完成工作。其目标是像工程团队的管理者一样运作,通过Asana或Slack等工作系统分配问题,并在解决方案达成时进行检查。
对于那些相信高性能AI的人来说,这是自动化逐步接管更多软件工作的自然进程中的下一个逻辑步骤。
“最开始,人们通过每一次按键来编写代码,”普林斯顿研究员兼SWE-Agent团队成员Kilian Lieret解释道,”GitHub ...
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道AI对能源的渴求正在演变成一个巨大的挑战。这不仅仅关乎电费支出,其环境影响也十分严重,包括消耗宝贵的水资源、产生大量电子垃圾,以及增加温室气体排放。
随着AI模型变得越来越复杂并融入我们生活的更多领域,一个巨大的问题悬而未决:我们能否在不损害地球环境的前提下推动这场革命?
AI能源需求呈爆炸式增长最先进AI所需的计算能力正以令人难以置信的速度增长——有人说大约每隔几个月就会翻倍。这不是一个缓慢的上升曲线,而是一个可能使我们最乐观的能源规划都黯然失色的垂直攀升。
从规模上看,AI未来的能源需求可能很快就会消耗与日本、荷兰等整个国家或美国加利福尼亚州等大型州相当的电力。这样的数据让人开始意识到AI可能给我们所依赖的电网带来的潜在压力。
2024年全球电力需求创纪录地增长了4.3%,除了电动汽车的普及和工厂活动增加外,AI的扩张是其中的一个重要原因。
回溯到2022年,数据中心、AI和加密货币挖矿已经占全球电力使用量的近2%,约460太瓦时(TWh)。
到2024年,仅数据中心就消耗约415 TWh电力,占全球总量的1.5%左右,并以每 ...
OpenAI 发布 Codex 研究预览版:功能更强大的 AI 编码助手
OpenAI 发布 Codex 研究预览版:功能更强大的 AI 编码助手
上周五,OpenAI 宣布推出 Codex 的研究预览版,这是该公司迄今为止功能最为强大的 AI 编码智能体。
Codex 由 codex-1 模型驱动,该模型是 OpenAI o3 AI 推理模型的一个针对软件工程任务优化的版本。OpenAI 表示,与 o3相比,codex-1 能够生成更“简洁”的代码,更精确地遵循指令,并且会迭代运行代码测试,直至获得通过的结果。
这款 Codex 智能体在云端的沙盒化虚拟计算机中运行。通过与 GitHub 连接,Codex 的环境可以预装用户的代码库。OpenAI 称,这款 AI 编码智能体完成诸如编写简单功能、修复错误、解答代码库相关问题以及运行测试等任务,大约需要 1 到 30 分钟。
OpenAI 表示,Codex 可以同时处理多个软件工程任务,并且在运行时不会限制用户访问自己的计算机和浏览器。
Codex 从即日起逐步向 ChatGPT Pro、Enterprise 和 Team 的订阅用户开放。OpenAI 表示,用户初期将拥有对 Codex 的“充足访问权限”, ...
OpenAI 推出一对 AI 推理模型 o3 和 o4-mini
OpenAI 于 2025 年 4 月 16 日(美国东部时间)宣布推出两款全新的 AI 推理模型——o3 与 o4-mini,它们能够在给出最终回答前进行思考与推理。
本文中所有的 ChatGPT 服务,由 ChatShare 镜像站 提供,无需担心网络和地区限制,体验与官方一致。
OpenAI 称 o3 是迄今为止其最强大的推理模型,在数学、编程、逻辑推理、科学和视觉理解等多项测试中均优于此前型号;而 o4-mini 则在价格、速度与性能三者之间实现了更具竞争力的平衡,满足开发者在应用场景中对成本与效率的考量。
与以往的推理模型不同,o3 和 o4-mini 能够在 ChatGPT 里调用多种工具——包括网页浏览、Python 代码执行、图像处理与图像生成功能。从即日起,这两款模型以及 o4-mini 的另一个变体 o4-mini‑high(更注重回答的可靠性)已面向 Pro、Plus 与 Team 订阅用户开放。
此次发布也是 OpenAI 在全球 AI 赛道上迎战 Google、Meta、xAI、Anthropic 和 DeepSeek 等劲旅的一部分。尽管 OpenA ...
OpenAI发布GPT-4.1系列模型,主打编程能力提升
OpenAI在本周一推出了全新一代模型家族——GPT-4.1系列。没错,就是“4.1”,尽管OpenAI的命名方式已经让人有些摸不着头脑。
这一系列包括三个型号:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。据OpenAI介绍,这些模型在编程任务和指令遵循方面表现尤为出色。它们目前仅通过OpenAI的API提供,尚未集成到ChatGPT中。这些多模态模型拥有高达100万个token的上下文窗口,相当于一次性可处理约75万字的内容——比《战争与和平》的篇幅还要长。
编程领域的激烈竞争GPT-4.1的发布正值AI行业竞争白热化之际。谷歌和Anthropic等公司也在加紧研发更强大的编程模型。例如,谷歌最近推出的Gemini 2.5 Pro同样具备100万个token的上下文窗口,在多个编程基准测试中名列前茅。Anthropic的Claude 3.7 Sonnet以及中国AI初创公司DeepSeek升级后的V3模型同样表现不俗。
对于包括OpenAI在内的科技巨头来说,目标是打造能够胜任复杂软件工程任务的AI模型。OpenAI首席财务官Sarah Friar在上个月伦敦 ...
Meta 发布 Llama 4,新一代旗舰 AI 模型
Meta在周六发布了Llama家族的最新系列人工智能模型——Llama 4。
此次共推出四个新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。据Meta称,所有模型都经过了”大量无标签文本、图像和视频数据”的训练,赋予它们”广泛的视觉理解能力”。
DeepSeek推出的开源模型取得成功,其性能与Meta之前的旗舰Llama模型相当甚至更优,这促使Llama的开发进入加速模式。传闻Meta组建了专项团队研究DeepSeek如何降低R1和V3等模型的运行和部署成本。
Scout和Maverick已在Llama.com和Meta的合作伙伴平台(包括AI开发平台Hugging Face)上公开提供,而Behemoth仍在训练中。Meta表示,其人工智能助手Meta AI已升级为使用Llama 4,覆盖WhatsApp、Messenger和Instagram等应用,目前在40个国家可用。多模态功能暂时仅限美国地区使用英语。
一些开发者可能会对Llama 4的许可条款有异议。
“居住地”或”主要营业地”在欧盟的用户和公司被禁止使用或分发这些模型 ...
OpenAI 升级其转录和语音生成 AI 模型
OpenAI 正在为其 API 推出新的转录和语音生成 AI 模型,公司声称这些模型在其之前的版本基础上有了显著改进。
对于 OpenAI 来说,这些模型契合其更广泛的“代理”愿景:构建能够代表用户独立完成任务的自动化系统。虽然“代理”的定义可能存在争议,但 OpenAI 产品负责人 Olivier Godement 在一次简报会上将其中的一种解释描述为能够与企业客户交谈的聊天机器人。
“我们将在未来几个月看到越来越多的代理出现,”Godement 表示,“总体主题是帮助客户和开发者利用那些实用、可用且准确的代理。”
OpenAI 声称,其新的文本转语音模型“gpt-4o-mini-tts”不仅能提供更细腻、更逼真的语音效果,而且比上一代语音合成模型更具“可控性”。开发者可以用自然语言指示 gpt-4o-mini-tts 如何发声,例如“像疯狂科学家一样说话”或“用平静的声音,像正念老师那样”。
OpenAI 产品团队成员 Jeff Harris 表示,他们的目标是让开发者能够定制语音的“体验”和“语境”。
“在不同的情境中,你不希望听到平淡单调的声音,”Harris 说,“如果你在一 ...
2024年和2025年最热门的AI模型:功能与使用指南
近年来,AI模型的发布速度令人目不暇接。从谷歌这样的科技巨头,到OpenAI、Anthropic等初创企业,都在不断推出新产品。对于普通用户来说,追踪这些最新模型可能会让人感到有些吃力。
更让人困惑的是,许多AI模型往往以行业基准测试数据作为宣传噱头,但这些技术指标往往无法真正反映普通人和企业在实际使用中的体验。
为了帮助大家理清思路,我们整理了一份自2024年以来发布的最前沿AI模型概览,详细介绍它们的功能、最佳使用场景以及如何使用。我们也会持续更新这份列表,加入最新的模型信息。
目前,全球AI模型数量已经超过百万。例如,Hugging Face平台就托管了超过140万个模型。因此,这份列表难免会遗漏一些在特定领域表现更优的模型。
2025年发布的AI模型Cohere的Aya VisionCohere推出了一款名为Aya Vision的多模态模型,据称在图像描述和回答图片相关问题方面表现出色。Cohere还表示,这款模型在非英语语言上的表现也优于其他同类产品。目前,它在WhatsApp上免费开放使用。
OpenAI的GPT 4.5 “Orion”OpenAI将Orion称为他们迄今为 ...
DeepSeek开源周第三日:推出面向AI训练推理的FP8矩阵计算库DeepGEMM
DeepSeek在其”开源周”第三天宣布推出DeepGEMM,这是一个支持FP8通用矩阵乘法(GEMM)的开源库。该工具专为密集型和混合专家(MoE)矩阵运算设计,有力支持DeepSeek V3和R1模型的训练和推理。官方通过X平台发布的公告迅速在科技社区引起了广泛关注。
根据DeepSeek在X上的官方发布,DeepGEMM在NVIDIA Hopper GPU上实现了高达1350+TFLOPS的FP8计算性能。其核心逻辑仅由约300行代码组成,却在大多数矩阵尺寸上超越了专家调优的内核,展现出卓越的效率和简洁性。该库不需要复杂的依赖项,使用即时(JIT)编译,支持密集布局和两种MoE布局,并以”教程式”的清晰设计便于学习和使用。
X用户@TechBitDaily评论:”DeepGEMM的发布是DeepSeek开源周的亮点;其FP8性能和简洁设计令人印象深刻。”另一位用户@AIObserverCN注意到该库在支持MoE模型高效训练方面具有显著优势,有望在Hopper架构上推动AI社区的进一步创新。
作为开源周的一部分,DeepGEMM的发布延续了DeepSeek推动AI技术透明化和社区 ...