就在几天前,OpenAI向全世界展示了其最新的旗舰生成模型o1。作为一个“推理”模型,o1在回答问题之前会花更长的时间“思考”,将问题分解并自我检查答案。

o1有许多不能胜任的事情,OpenAI自己也承认这一点。但在某些任务上,比如物理和数学,o1表现出色,尽管它的参数量并不一定比OpenAI以前的顶级模型GPT-4o多。(在AI和机器学习领域,“参数”通常以数十亿计,大致对应于模型解决问题的能力。)

这对AI监管具有重要意义。

例如,加利福尼亚州提议的SB 1047法案对开发成本超过1亿美元或使用超过一定计算能力训练的AI模型提出了安全要求。然而,像o1这样的模型表明,提升模型性能并不只有扩大训练计算资源一条路。

Nvidia研究经理Jim Fan在X上的一篇帖子中推测,未来的AI系统可能会依赖小型、易于训练的“推理核心”,而非近期流行的训练密集型架构(如Meta的Llama 405B)。他指出,最近的学术研究表明,小型模型如o1在有更多时间思考问题时,可以远超大型模型。

因此,政策制定者将AI监管措施与计算能力挂钩是不是短视了呢?Cohere AI初创公司研究实验室负责人Sara Hooker在接受采访时表示,是的。

那么,这是否意味着立法者应该推翻AI法案的基础,重新开始呢?也不尽然。许多法律是为了在AI不断发展超越其颁布时,能够轻易进行修改。例如,加利福尼亚州的法案将赋予州政府操作部门重新定义触发法律安全要求的计算能力阈值的权力。

难点在于找到比训练计算能力更好的风险代理指标。正如AI监管的许多其他方面一样,这是在美国乃至全世界通过相关法案时需要考虑的问题。

新闻

AI新闻图片

o1的初始反应:Max从AI研究人员、初创公司创始人和风险投资者那里得到了对o1的初步印象,并亲自测试了该模型。

Altman退出安全委员会:OpenAI首席执行官Sam Altman退出了负责审查o1等模型安全性的委员会,可能是为了应对他无法保持公正的担忧。

Slack成为代理中心:在其母公司Salesforce的年度Dreamforce大会上,Slack宣布了新功能,包括AI生成的会议摘要和与图像生成及AI驱动的网络搜索工具的集成。

谷歌开始标记AI图像:谷歌表示计划对谷歌搜索进行更改,以更清晰地标注搜索结果中由AI生成或由AI工具编辑的图像。

Mistral推出免费层:法国AI初创公司Mistral推出了一个新的免费层,允许开发人员使用该公司的AI模型进行微调和构建测试应用程序。

Snap推出视频生成器:在周二举行的年度Snap合作伙伴峰会上,Snapchat宣布推出新的AI视频生成工具,允许精选创作者从文本提示生成AI视频,未来还将支持从图像提示生成。

英特尔签署重大芯片协议:英特尔表示将与AWS合作开发一款使用英特尔18A芯片制造工艺的AI芯片。双方将此交易描述为一项“多年、多亿美元的框架”,可能涉及额外的芯片设计。

奥普拉的AI特别节目:奥普拉·温弗瑞播出了一档AI专题节目,嘉宾包括OpenAI的Sam Altman、微软的比尔·盖茨、科技影响者Marques Brownlee和现任FBI局长Christopher Wray。

本周研究论文

我们知道AI可以具有说服力,但它能把人从阴谋论的深渊中拯救出来吗?不完全是。麻省理工学院和康奈尔大学的Costello等人的一项新模型可以在至少几个月内削弱人们对不真实阴谋的信念。

在实验中,他们让相信阴谋论(例如“9/11是内部阴谋”)的人与一个温和、耐心且不断为其论点提供反证的聊天机器人进行对话。结果显示,参与者两个月后对相关信念的认同度下降了20%。以下是一个对话进行中的例子:

对话例子

那些深陷爬虫人和深层政府阴谋论的人不太可能咨询或相信这样的AI,但这种方法可能在关键时刻更有效,例如某人第一次涉足这些理论时。例如,如果一个青少年搜索“喷气燃料能融化钢梁吗?”,他们可能会迎来一个学习的时刻,而不是一个悲剧的时刻。

本周模型

这不是一个模型,但与模型有关:微软的研究人员本周发布了一个名为Eureka的AI基准测试,旨在(用他们的话说)“在开放和透明的环境中扩大[模型]评估”。

AI基准测试层出不穷。那么Eureka有什么不同呢?研究人员表示,Eureka实际上是一个现有基准的集合,他们选择了对“即使是最有能力的模型”来说仍然具有挑战性的任务。具体来说,Eureka测试了AI基准中常被忽视的能力,如视觉空间导航技能。

为了展示Eureka对模型的挑战性,研究人员测试了包括Anthropic的Claude、OpenAI的GPT-4o和Meta的Llama在内的系统。没有一个模型在所有Eureka测试中表现良好,这凸显了“持续创新”和“针对性改进”模型的重要性。

杂项

加利福尼亚通过了两项法律,AB 2602和AB 1836,限制了AI数字复制品的使用,这对职业演员来说是一个胜利。

这项立法得到了SAG-AFTRA(美国影视演员联合会)的支持,要求依赖演员数字复制品(例如克隆的声音或图像)的公司提供对复制品预期用途的“合理具体”描述,并与演员的法律顾问或工会谈判。它还要求娱乐雇主在使用已故演员的数字复制品之前获得其遗产的同意。

正如《好莱坞记者》在其报道中指出的那样,这些法案将SAG-AFTRA去年与工作室和主要流媒体平台为期118天的罢工中争取的概念编入了法律。加利福尼亚是继田纳西之后第二个对数字演员肖像的使用进行限制的州;SAG-AFTRA也赞助了田纳西的努力。