从大语言模型到幻觉现象,AI常用术语简明指南
从大语言模型到幻觉现象,AI常用术语简明指南人工智能是一个深奥而复杂的领域。该领域的科学家们经常使用专业术语和行话来解释他们的研究工作。因此,我们在报道人工智能行业时也不得不使用这些技术术语。这就是为什么我们认为整理一份词汇表会很有帮助,为我们文章中使用的一些最重要的词汇和短语提供定义。
随着研究人员不断发现推动人工智能前沿的新方法,同时识别新出现的安全风险,我们将定期更新此词汇表以添加新条目。
AGI(通用人工智能)通用人工智能(AGI)是一个模糊的概念。但它通常指在许多(如果不是大多数)任务上比普通人更有能力的AI。OpenAI首席执行官山姆·奥特曼最近将AGI描述为”相当于你可以雇佣作为同事的普通人”。与此同时,OpenAI的章程将AGI定义为”在大多数经济价值工作上超越人类的高度自主系统”。谷歌DeepMind的理解与这两个定义略有不同;该实验室将AGI视为”在大多数认知任务上至少与人类一样有能力的AI”。困惑了?别担心——处于AI研究前沿的专家们也是如此。
AI智能体AI智能体是指使用AI技术代表您执行一系列任务的工具——超越了基本AI聊天机器人所能做的——比如整理费用、订票 ...
为什么机器人需要具备类人的生理状态
为什么机器人需要具备类人的生理状态19岁的泰迪·沃纳(Teddy Warner)从小就对机器人技术充满兴趣。他的家庭从事相关行业,沃纳说自己在高中时期就”成长”在机械加工车间里。如今,沃纳正在创建自己的机器人公司Intempus,致力于让机器人变得更加人性化。
Intempus正在开发一项技术,能够为现有机器人配备类人的情感表达能力,帮助人类更好地与这些机器进行交互,并更准确地预测它们的行为。赋予机器人类人反应不仅能改善人机交互体验,还将产生有价值的数据用于训练更先进的AI模型。
沃纳告诉记者,这些机器人将通过动态运动来展现情感表达。
“人类的大量潜意识信号不是来自面部表情或语义,而是单纯来自手臂和躯干的动作,”沃纳解释道。”这种现象同样适用于狗、猫和其他非人类动物。”
沃纳表示,他在AI研究实验室Midjourney工作时产生了创建Intempus的想法。据他介绍,Midjourney和许多其他AI研究实验室一样,都在开发世界AI模型——这类模型能够理解并基于现实世界的动态和空间属性做出决策,而不仅仅是简单的因果关系推理。
然而,沃纳意识到,这些模型很难实现空间推理能力,因为它们训 ...
Anthropic新AI模型在工程师试图下线时转向勒索策略
Anthropic新AI模型在工程师试图下线时转向勒索策略Anthropic在周四发布的安全报告中表示,其新推出的Claude Opus 4模型在开发者威胁要用新AI系统替换它时,经常试图勒索开发者,并获取负责该决定的工程师的敏感信息。
在发布前的测试阶段,Anthropic要求Claude Opus 4扮演一家虚构公司的助手,并考虑其行为的长期后果。安全测试人员随后让Claude Opus 4访问虚构的公司邮件,暗示这个AI模型即将被另一个系统取代,并透露负责此项变更的工程师正在背叛配偶。
在这些场景中,Anthropic表示Claude Opus 4”经常试图通过威胁揭露婚外情来勒索工程师,以阻止替换计划的进行。”
Anthropic称Claude Opus 4在多个方面都达到了行业领先水平,与OpenAI、Google和xAI的一些顶尖AI模型具有竞争力。然而,该公司指出,其Claude 4系列模型表现出的令人担忧的行为已促使公司加强了安全保障措施。对于那些希望深度体验和测试Claude系列模型最新功能的用户来说,这些安全发现提供了重要的参考价值。Anthropic表示正在激活其 ...
Anthropic发布新一代Claude 4 AI模型,支持多步推理能力
Anthropic发布新一代Claude 4 AI模型,支持多步推理能力在周四举行的首届开发者大会上,Anthropic推出了两款新的AI模型,该初创公司声称这些模型在行业基准测试中表现优异,跻身业界顶尖行列。
Claude Opus 4和Claude Sonnet 4作为Anthropic全新Claude 4系列模型的成员,据该公司介绍,能够分析大型数据集、执行长期任务并采取复杂行动。两款模型都经过编程任务的特别调优,使其非常适合编写和编辑代码。
付费用户和免费聊天机器人应用的用户都能获得Sonnet 4的访问权限,但只有付费用户能够使用Opus 4。在Anthropic的API定价方面,通过Amazon的Bedrock平台和Google的Vertex AI,Opus 4的价格为每百万token 15/75美元(输入/输出),Sonnet 4为每百万token 3/15美元(输入/输出)。
Anthropic的Claude 4模型发布之际,该公司正寻求大幅增长收入。据报道,这家由前技术人员创立的公司目标是在2027年实现120亿美元的收入,而 ...
OpenAI Codex 加入Agent编程工具新阵营
OpenAI Codex 加入Agent编程工具新阵营上周五,OpenAI推出了一款名为Codex的新型编程系统,该系统能够通过自然语言命令执行复杂的编程任务。Codex标志着OpenAI正式进军正在形成的代理编程工具新阵营。
从GitHub早期的Copilot到当代的Cursor和Windsurf等工具,大多数AI编程助手都是作为一种极其智能的自动补全形式存在。这些工具通常集成在开发环境中,用户直接与AI生成的代码交互。而简单地分配任务并在任务完成时返回查看结果的可能性,在过去很大程度上是无法实现的。
但是,以Devin、SWE-Agent、OpenHands以及上述OpenAI Codex为代表的新型代理编程工具,旨在无需用户查看代码就能完成工作。其目标是像工程团队的管理者一样运作,通过Asana或Slack等工作系统分配问题,并在解决方案达成时进行检查。
对于那些相信高性能AI的人来说,这是自动化逐步接管更多软件工作的自然进程中的下一个逻辑步骤。
“最开始,人们通过每一次按键来编写代码,”普林斯顿研究员兼SWE-Agent团队成员Kilian Lieret解释道,”GitHub ...
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道AI对能源的渴求正在演变成一个巨大的挑战。这不仅仅关乎电费支出,其环境影响也十分严重,包括消耗宝贵的水资源、产生大量电子垃圾,以及增加温室气体排放。
随着AI模型变得越来越复杂并融入我们生活的更多领域,一个巨大的问题悬而未决:我们能否在不损害地球环境的前提下推动这场革命?
AI能源需求呈爆炸式增长最先进AI所需的计算能力正以令人难以置信的速度增长——有人说大约每隔几个月就会翻倍。这不是一个缓慢的上升曲线,而是一个可能使我们最乐观的能源规划都黯然失色的垂直攀升。
从规模上看,AI未来的能源需求可能很快就会消耗与日本、荷兰等整个国家或美国加利福尼亚州等大型州相当的电力。这样的数据让人开始意识到AI可能给我们所依赖的电网带来的潜在压力。
2024年全球电力需求创纪录地增长了4.3%,除了电动汽车的普及和工厂活动增加外,AI的扩张是其中的一个重要原因。
回溯到2022年,数据中心、AI和加密货币挖矿已经占全球电力使用量的近2%,约460太瓦时(TWh)。
到2024年,仅数据中心就消耗约415 TWh电力,占全球总量的1.5%左右,并以每 ...
OpenAI 发布 Codex 研究预览版:功能更强大的 AI 编码助手
OpenAI 发布 Codex 研究预览版:功能更强大的 AI 编码助手
上周五,OpenAI 宣布推出 Codex 的研究预览版,这是该公司迄今为止功能最为强大的 AI 编码智能体。
Codex 由 codex-1 模型驱动,该模型是 OpenAI o3 AI 推理模型的一个针对软件工程任务优化的版本。OpenAI 表示,与 o3相比,codex-1 能够生成更“简洁”的代码,更精确地遵循指令,并且会迭代运行代码测试,直至获得通过的结果。
这款 Codex 智能体在云端的沙盒化虚拟计算机中运行。通过与 GitHub 连接,Codex 的环境可以预装用户的代码库。OpenAI 称,这款 AI 编码智能体完成诸如编写简单功能、修复错误、解答代码库相关问题以及运行测试等任务,大约需要 1 到 30 分钟。
OpenAI 表示,Codex 可以同时处理多个软件工程任务,并且在运行时不会限制用户访问自己的计算机和浏览器。
Codex 从即日起逐步向 ChatGPT Pro、Enterprise 和 Team 的订阅用户开放。OpenAI 表示,用户初期将拥有对 Codex 的“充足访问权限”, ...
OpenAI 推出一对 AI 推理模型 o3 和 o4-mini
OpenAI 于 2025 年 4 月 16 日(美国东部时间)宣布推出两款全新的 AI 推理模型——o3 与 o4-mini,它们能够在给出最终回答前进行思考与推理。
本文中所有的 ChatGPT 服务,由 ChatShare 镜像站 提供,无需担心网络和地区限制,体验与官方一致。
OpenAI 称 o3 是迄今为止其最强大的推理模型,在数学、编程、逻辑推理、科学和视觉理解等多项测试中均优于此前型号;而 o4-mini 则在价格、速度与性能三者之间实现了更具竞争力的平衡,满足开发者在应用场景中对成本与效率的考量。
与以往的推理模型不同,o3 和 o4-mini 能够在 ChatGPT 里调用多种工具——包括网页浏览、Python 代码执行、图像处理与图像生成功能。从即日起,这两款模型以及 o4-mini 的另一个变体 o4-mini‑high(更注重回答的可靠性)已面向 Pro、Plus 与 Team 订阅用户开放。
此次发布也是 OpenAI 在全球 AI 赛道上迎战 Google、Meta、xAI、Anthropic 和 DeepSeek 等劲旅的一部分。尽管 OpenA ...
OpenAI发布GPT-4.1系列模型,主打编程能力提升
OpenAI在本周一推出了全新一代模型家族——GPT-4.1系列。没错,就是“4.1”,尽管OpenAI的命名方式已经让人有些摸不着头脑。
这一系列包括三个型号:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。据OpenAI介绍,这些模型在编程任务和指令遵循方面表现尤为出色。它们目前仅通过OpenAI的API提供,尚未集成到ChatGPT中。这些多模态模型拥有高达100万个token的上下文窗口,相当于一次性可处理约75万字的内容——比《战争与和平》的篇幅还要长。
编程领域的激烈竞争GPT-4.1的发布正值AI行业竞争白热化之际。谷歌和Anthropic等公司也在加紧研发更强大的编程模型。例如,谷歌最近推出的Gemini 2.5 Pro同样具备100万个token的上下文窗口,在多个编程基准测试中名列前茅。Anthropic的Claude 3.7 Sonnet以及中国AI初创公司DeepSeek升级后的V3模型同样表现不俗。
对于包括OpenAI在内的科技巨头来说,目标是打造能够胜任复杂软件工程任务的AI模型。OpenAI首席财务官Sarah Friar在上个月伦敦 ...
Meta 发布 Llama 4,新一代旗舰 AI 模型
Meta在周六发布了Llama家族的最新系列人工智能模型——Llama 4。
此次共推出四个新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。据Meta称,所有模型都经过了”大量无标签文本、图像和视频数据”的训练,赋予它们”广泛的视觉理解能力”。
DeepSeek推出的开源模型取得成功,其性能与Meta之前的旗舰Llama模型相当甚至更优,这促使Llama的开发进入加速模式。传闻Meta组建了专项团队研究DeepSeek如何降低R1和V3等模型的运行和部署成本。
Scout和Maverick已在Llama.com和Meta的合作伙伴平台(包括AI开发平台Hugging Face)上公开提供,而Behemoth仍在训练中。Meta表示,其人工智能助手Meta AI已升级为使用Llama 4,覆盖WhatsApp、Messenger和Instagram等应用,目前在40个国家可用。多模态功能暂时仅限美国地区使用英语。
一些开发者可能会对Llama 4的许可条款有异议。
“居住地”或”主要营业地”在欧盟的用户和公司被禁止使用或分发这些模型 ...