本周人工智能界的重大新闻是OpenAI又失去了一位联合创始人。

在ChatGPT(OpenAI的AI驱动聊天机器人平台)开发中发挥关键作用的John Schulman离开了公司,加入了竞争对手Anthropic。Schulman在X平台上宣布了这一消息,称他的决定源于希望更深入地专注于AI对齐(确保AI按预期行为的科学),并从事更多实际的技术工作。

但不禁让人猜测,Schulman离职的时机是否别有用意,因为它恰逢OpenAI总裁Greg Brockman请长假至年底。

就在Schulman宣布离职的同一天,OpenAI透露计划改变今年DevDay活动的形式,选择一系列巡回开发者交流会,而非举办一场盛大的一日会议。一位发言人告诉TechCrunch,OpenAI不会在DevDay期间发布新模型,这暗示公司目前旗舰产品GPT-4的继任者研发进展缓慢。(英伟达Blackwell GPU的延迟可能会进一步放缓进度。)

OpenAI是否陷入困境?Schulman是否看到了不祥之兆?无疑,Sam Altman帝国的前景比一年前黯淡许多。

公关专家兼科技评论家Ed Zitron最近在他的通讯中概述了OpenAI通往持续成功之路上的诸多障碍。这是一篇研究充分、内容详实的文章,我不会不公平地重复其中的观点。但Zitron提出的关于OpenAI日益增加的业绩压力值得关注。

据报道,OpenAI今年预计亏损50亿美元。为了应对不断上升的人力成本(AI研究人员非常昂贵)、模型训练和大规模模型服务,该公司将不得不在未来12到24个月内筹集一笔巨额资金。微软将是显而易见的资金来源;它持有OpenAI 49%的股份,尽管有时存在竞争关系,但与OpenAI的产品团队保持着密切的合作关系。但是,鉴于微软的资本支出同比增长75%(达到190亿美元),以期待尚未实现的AI回报,它是否真的有胃口再向一个长期的高风险投资倾注数十亿美元?

作为世界上最著名的AI公司,如果OpenAI最终无法从某个地方筹集到所需资金,本报记者会感到惊讶。然而,这条生命线很可能会附带一些不太有利的条件——或许还包括长期传言的公司有限利润结构的调整。

生存可能意味着OpenAI将进一步偏离其最初的使命,进入未知和不确定的领域。也许这对Schulman(及其他人)来说是一个太难接受的苦果。很难怪罪他们;随着投资者和企业的怀疑情绪升温,整个AI行业,而不仅仅是OpenAI,都面临着一场清算。

新闻速览

Apple Intelligence存在局限性:通过上月发布的iOS 18.1开发者测试版,Apple首次让用户真正体验到了Apple Intelligence功能。但正如Ivan所写,写作工具功能在处理脏话和敏感话题(如毒品和谋杀)时表现不佳。

Google’s Nest Learning恒温器改头换面:经过漫长的九年,Google终于对赋予Nest品牌名称的设备进行了更新。该公司周二宣布推出Nest Learning恒温器4——在原版发布13年后,Learning恒温器3发布近十年后,并在下周的Made by Google 2024活动之前。

X的聊天机器人传播选举虚假信息:根据五位州务卿致特斯拉、SpaceX和X公司CEO埃隆·马斯克的公开信,X的AI驱动聊天机器人Grok在X平台(前身为Twitter)上传播了关于副总统卡玛拉·哈里斯的虚假信息。信中称,Grok错误地暗示哈里斯没有资格出现在某些2024年美国总统选举投票中。

YouTuber起诉OpenAI:一位YouTube创作者正寻求对OpenAI提起集体诉讼,指控该公司在未通知或补偿视频所有者的情况下,使用数百万个YouTube视频的转录文本来训练其生成式AI模型。

AI游说活动升温:在生成式AI持续繁荣和可能影响未来AI监管的选举年背景下,美国联邦层面的AI游说活动正在加剧。从2023年的459个增加到2024年1月至7月上半年的556个,针对AI相关问题游说联邦政府的团体数量有所增长。

本周研究论文

像Meta的Llama系列这样的”开放”模型可以被开发者随意使用,这可能会促进创新——但同时也带来风险。诚然,许多模型都有施加限制的许可证,以及内置的安全过滤器和工具。但除此之外,几乎没有什么可以阻止不法分子使用开放模型来传播虚假信息或建立内容工厂。

未来可能会有所改变。

来自哈佛大学、非营利组织人工智能安全中心等机构的一组研究人员在一篇技术论文中提出了一种”防篡改”方法,可以在保留模型”良性能力”的同时防止模型产生不良行为。在实验中,他们发现这种方法在防止模型”攻击”(如诱导它提供不应提供的信息)方面非常有效,代价是模型准确性略有下降。

但有一个问题。由于”计算挑战”需要”优化”以减少开销,该方法在扩展到更大的模型时效果不佳,研究人员在论文中解释道。因此,虽然早期工作很有希望,但不要期望它能很快部署。

本周模型

最近出现了一个新的图像生成模型,看起来可以与Midjourney和OpenAI的DALL-E 3等现有模型一较高下。

这个名为Flux.1的模型(或者说,模型系列)是由Black Forest Labs开发的,这是一家由前Stability AI研究人员创立的初创公司,其中许多人参与了Stable Diffusion及其众多后续版本的创建。(Black Forest Labs上周宣布了首轮融资:由Andreessen Horowitz领投的3100万美元种子轮。)

最复杂的Flux.1模型Flux.1 Pro被API所限制。但Black Forest Labs在AI开发平台Hugging Face上发布了两个较小的模型,Flux.1 Dev和Flux.1 Schnell(德语中”快速”的意思),对商业使用有轻微限制。Black Forest Labs声称,这两个模型在生成图像质量和遵循提示的能力方面都可以与Midjourney和DALL-E 3竞争。它们在图像中插入文本方面尤其出色,这是历史上一直困扰图像生成模型的一项技能。

Black Forest Labs选择不分享用于训练模型的数据(考虑到这种AI图像生成固有的版权风险,这引起了一些担忧),该初创公司也没有详细说明它打算如何防止Flux.1被滥用。目前,它采取了一种明显放手的方法——因此用户需要谨慎。

杂项

生成式AI公司越来越多地在未经数据所有者同意的情况下使用受版权保护的数据来训练模型时,拥抱公平使用辩护。例如,AI音乐生成平台Suno最近在法庭上辩称,它有权在艺术家和唱片公司不知情且不给予补偿的情况下使用属于他们的歌曲。

据报道,这也是英伟达(也许是一厢情愿的)想法。根据404 Media本周的一份报告,英伟达正在训练一个代号为Cosmos的大型视频生成模型,使用YouTube和Netflix的内容。高层管理人员批准了这个项目,他们认为根据目前美国版权法的解释,这个项目能够在法庭战斗中幸存。

那么,公平使用原则能否将Suno、英伟达、OpenAI和Midjourney等公司从法律地狱中拯救出来?有待观察——而且诉讼肯定会持续很长时间。在确立先例之前,生成式AI泡沫可能已经破裂。如果情况并非如此,要么创作者——从艺术家到音乐家、作家、作词人和视频制作者——可以期待一笔巨额收入,要么他们将不得不接受这样一个令人不安的事实:他们公开的任何作品都可能成为生成式AI公司训练的素材。