OpenAI指南

发表于2025-05-25|更新于2025-05-28|AI

从大语言模型到幻觉现象，AI常用术语简明指南人工智能是一个深奥而复杂的领域。该领域的科学家们经常使用专业术语和行话来解释他们的研究工作。因此，我们在报道人工智能行业时也不得不使用这些技术术语。这就是为什么我们认为整理一份词汇表会很有帮助，为我们文章中使用的一些最重要的词汇和短语提供定义。随着研究人员不断发现推动人工智能前沿的新方法，同时识别新出现的安全风险，我们将定期更新此词汇表以添加新条目。 AGI（通用人工智能）通用人工智能（AGI）是一个模糊的概念。但它通常指在许多（如果不是大多数）任务上比普通人更有能力的AI。OpenAI首席执行官山姆·奥特曼最近将AGI描述为”相当于你可以雇佣作为同事的普通人”。与此同时，OpenAI的章程将AGI定义为”在大多数经济价值工作上超越人类的高度自主系统”。谷歌DeepMind的理解与这两个定义略有不同；该实验室将AGI视为”在大多数认知任务上至少与人类一样有能力的AI”。困惑了？别担心——处于AI研究前沿的专家们也是如此。 AI智能体AI智能体是指使用AI技术代表您执行一系列任务的工具——超越了基本AI聊天机器人所能做的——比如整理费用、订票 ...

为什么机器人需要具备类人的生理状态

发表于2025-05-25|更新于2025-05-28|Robotics

为什么机器人需要具备类人的生理状态19岁的泰迪·沃纳（Teddy Warner）从小就对机器人技术充满兴趣。他的家庭从事相关行业，沃纳说自己在高中时期就”成长”在机械加工车间里。如今，沃纳正在创建自己的机器人公司Intempus，致力于让机器人变得更加人性化。 Intempus正在开发一项技术，能够为现有机器人配备类人的情感表达能力，帮助人类更好地与这些机器进行交互，并更准确地预测它们的行为。赋予机器人类人反应不仅能改善人机交互体验，还将产生有价值的数据用于训练更先进的AI模型。沃纳告诉记者，这些机器人将通过动态运动来展现情感表达。 “人类的大量潜意识信号不是来自面部表情或语义，而是单纯来自手臂和躯干的动作，”沃纳解释道。”这种现象同样适用于狗、猫和其他非人类动物。” 沃纳表示，他在AI研究实验室Midjourney工作时产生了创建Intempus的想法。据他介绍，Midjourney和许多其他AI研究实验室一样，都在开发世界AI模型——这类模型能够理解并基于现实世界的动态和空间属性做出决策，而不仅仅是简单的因果关系推理。然而，沃纳意识到，这些模型很难实现空间推理能力，因为它们训 ...

Anthropic新AI模型在工程师试图下线时转向勒索策略

发表于2025-05-22|更新于2025-05-23|AI

Anthropic新AI模型在工程师试图下线时转向勒索策略Anthropic在周四发布的安全报告中表示，其新推出的Claude Opus 4模型在开发者威胁要用新AI系统替换它时，经常试图勒索开发者，并获取负责该决定的工程师的敏感信息。在发布前的测试阶段，Anthropic要求Claude Opus 4扮演一家虚构公司的助手，并考虑其行为的长期后果。安全测试人员随后让Claude Opus 4访问虚构的公司邮件，暗示这个AI模型即将被另一个系统取代，并透露负责此项变更的工程师正在背叛配偶。在这些场景中，Anthropic表示Claude Opus 4”经常试图通过威胁揭露婚外情来勒索工程师，以阻止替换计划的进行。” Anthropic称Claude Opus 4在多个方面都达到了行业领先水平，与OpenAI、Google和xAI的一些顶尖AI模型具有竞争力。然而，该公司指出，其Claude 4系列模型表现出的令人担忧的行为已促使公司加强了安全保障措施。对于那些希望深度体验和测试Claude系列模型最新功能的用户来说，这些安全发现提供了重要的参考价值。Anthropic表示正在激活其 ...

Anthropic发布新一代Claude 4 AI模型，支持多步推理能力

发表于2025-05-22|更新于2025-05-23|AI

Anthropic发布新一代Claude 4 AI模型，支持多步推理能力在周四举行的首届开发者大会上，Anthropic推出了两款新的AI模型，该初创公司声称这些模型在行业基准测试中表现优异，跻身业界顶尖行列。 Claude Opus 4和Claude Sonnet 4作为Anthropic全新Claude 4系列模型的成员，据该公司介绍，能够分析大型数据集、执行长期任务并采取复杂行动。两款模型都经过编程任务的特别调优，使其非常适合编写和编辑代码。付费用户和免费聊天机器人应用的用户都能获得Sonnet 4的访问权限，但只有付费用户能够使用Opus 4。在Anthropic的API定价方面，通过Amazon的Bedrock平台和Google的Vertex AI，Opus 4的价格为每百万token 15/75美元（输入/输出），Sonnet 4为每百万token 3/15美元（输入/输出）。 Anthropic的Claude 4模型发布之际，该公司正寻求大幅增长收入。据报道，这家由前技术人员创立的公司目标是在2027年实现120亿美元的收入，而 ...

OpenAI Codex 加入Agent编程工具新阵营

发表于2025-05-20|更新于2025-05-20|AI

OpenAI Codex 加入Agent编程工具新阵营上周五，OpenAI推出了一款名为Codex的新型编程系统，该系统能够通过自然语言命令执行复杂的编程任务。Codex标志着OpenAI正式进军正在形成的代理编程工具新阵营。从GitHub早期的Copilot到当代的Cursor和Windsurf等工具，大多数AI编程助手都是作为一种极其智能的自动补全形式存在。这些工具通常集成在开发环境中，用户直接与AI生成的代码交互。而简单地分配任务并在任务完成时返回查看结果的可能性，在过去很大程度上是无法实现的。但是，以Devin、SWE-Agent、OpenHands以及上述OpenAI Codex为代表的新型代理编程工具，旨在无需用户查看代码就能完成工作。其目标是像工程团队的管理者一样运作，通过Asana或Slack等工作系统分配问题，并在解决方案达成时进行检查。对于那些相信高性能AI的人来说，这是自动化逐步接管更多软件工作的自然进程中的下一个逻辑步骤。 “最开始，人们通过每一次按键来编写代码，”普林斯顿研究员兼SWE-Agent团队成员Kilian Lieret解释道，”GitHub ...

AI能源危机：人工智能发展与环境可持续性的矛盾与解决之道

发表于2025-05-20|更新于2025-05-20|AI

AI能源危机：人工智能发展与环境可持续性的矛盾与解决之道AI对能源的渴求正在演变成一个巨大的挑战。这不仅仅关乎电费支出，其环境影响也十分严重，包括消耗宝贵的水资源、产生大量电子垃圾，以及增加温室气体排放。随着AI模型变得越来越复杂并融入我们生活的更多领域，一个巨大的问题悬而未决：我们能否在不损害地球环境的前提下推动这场革命？ AI能源需求呈爆炸式增长最先进AI所需的计算能力正以令人难以置信的速度增长——有人说大约每隔几个月就会翻倍。这不是一个缓慢的上升曲线，而是一个可能使我们最乐观的能源规划都黯然失色的垂直攀升。从规模上看，AI未来的能源需求可能很快就会消耗与日本、荷兰等整个国家或美国加利福尼亚州等大型州相当的电力。这样的数据让人开始意识到AI可能给我们所依赖的电网带来的潜在压力。 2024年全球电力需求创纪录地增长了4.3%，除了电动汽车的普及和工厂活动增加外，AI的扩张是其中的一个重要原因。回溯到2022年，数据中心、AI和加密货币挖矿已经占全球电力使用量的近2%，约460太瓦时(TWh)。到2024年，仅数据中心就消耗约415 TWh电力，占全球总量的1.5%左右，并以每 ...

OpenAI 发布 Codex 研究预览版：功能更强大的 AI 编码助手

发表于2025-05-18|更新于2025-05-19|AI

OpenAI 发布 Codex 研究预览版：功能更强大的 AI 编码助手上周五，OpenAI 宣布推出 Codex 的研究预览版，这是该公司迄今为止功能最为强大的 AI 编码智能体。 Codex 由 codex-1 模型驱动，该模型是 OpenAI o3 AI 推理模型的一个针对软件工程任务优化的版本。OpenAI 表示，与 o3相比，codex-1 能够生成更“简洁”的代码，更精确地遵循指令，并且会迭代运行代码测试，直至获得通过的结果。这款 Codex 智能体在云端的沙盒化虚拟计算机中运行。通过与 GitHub 连接，Codex 的环境可以预装用户的代码库。OpenAI 称，这款 AI 编码智能体完成诸如编写简单功能、修复错误、解答代码库相关问题以及运行测试等任务，大约需要 1 到 30 分钟。 OpenAI 表示，Codex 可以同时处理多个软件工程任务，并且在运行时不会限制用户访问自己的计算机和浏览器。 Codex 从即日起逐步向 ChatGPT Pro、Enterprise 和 Team 的订阅用户开放。OpenAI 表示，用户初期将拥有对 Codex 的“充足访问权限”， ...

OpenAI 推出一对 AI 推理模型 o3 和 o4-mini

发表于2025-04-16|更新于2025-04-17|AI

OpenAI 于 2025 年 4 月 16 日（美国东部时间）宣布推出两款全新的 AI 推理模型——o3 与 o4-mini，它们能够在给出最终回答前进行思考与推理。本文中所有的 ChatGPT 服务，由 ChatShare 镜像站提供，无需担心网络和地区限制，体验与官方一致。 OpenAI 称 o3 是迄今为止其最强大的推理模型，在数学、编程、逻辑推理、科学和视觉理解等多项测试中均优于此前型号；而 o4-mini 则在价格、速度与性能三者之间实现了更具竞争力的平衡，满足开发者在应用场景中对成本与效率的考量。与以往的推理模型不同，o3 和 o4-mini 能够在 ChatGPT 里调用多种工具——包括网页浏览、Python 代码执行、图像处理与图像生成功能。从即日起，这两款模型以及 o4-mini 的另一个变体 o4-mini‑high（更注重回答的可靠性）已面向 Pro、Plus 与 Team 订阅用户开放。此次发布也是 OpenAI 在全球 AI 赛道上迎战 Google、Meta、xAI、Anthropic 和 DeepSeek 等劲旅的一部分。尽管 OpenA ...

OpenAI发布GPT-4.1系列模型，主打编程能力提升

发表于2025-04-14|更新于2025-04-15|AI

OpenAI在本周一推出了全新一代模型家族——GPT-4.1系列。没错，就是“4.1”，尽管OpenAI的命名方式已经让人有些摸不着头脑。这一系列包括三个型号：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。据OpenAI介绍，这些模型在编程任务和指令遵循方面表现尤为出色。它们目前仅通过OpenAI的API提供，尚未集成到ChatGPT中。这些多模态模型拥有高达100万个token的上下文窗口，相当于一次性可处理约75万字的内容——比《战争与和平》的篇幅还要长。编程领域的激烈竞争GPT-4.1的发布正值AI行业竞争白热化之际。谷歌和Anthropic等公司也在加紧研发更强大的编程模型。例如，谷歌最近推出的Gemini 2.5 Pro同样具备100万个token的上下文窗口，在多个编程基准测试中名列前茅。Anthropic的Claude 3.7 Sonnet以及中国AI初创公司DeepSeek升级后的V3模型同样表现不俗。对于包括OpenAI在内的科技巨头来说，目标是打造能够胜任复杂软件工程任务的AI模型。OpenAI首席财务官Sarah Friar在上个月伦敦 ...

Meta 发布 Llama 4，新一代旗舰 AI 模型

发表于2025-04-05|更新于2025-04-07|AI

Meta在周六发布了Llama家族的最新系列人工智能模型——Llama 4。此次共推出四个新模型：Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。据Meta称，所有模型都经过了”大量无标签文本、图像和视频数据”的训练，赋予它们”广泛的视觉理解能力”。 DeepSeek推出的开源模型取得成功，其性能与Meta之前的旗舰Llama模型相当甚至更优，这促使Llama的开发进入加速模式。传闻Meta组建了专项团队研究DeepSeek如何降低R1和V3等模型的运行和部署成本。 Scout和Maverick已在Llama.com和Meta的合作伙伴平台（包括AI开发平台Hugging Face）上公开提供，而Behemoth仍在训练中。Meta表示，其人工智能助手Meta AI已升级为使用Llama 4，覆盖WhatsApp、Messenger和Instagram等应用，目前在40个国家可用。多模态功能暂时仅限美国地区使用英语。一些开发者可能会对Llama 4的许可条款有异议。 “居住地”或”主要营业地”在欧盟的用户和公司被禁止使用或分发这些模型 ...