本周AI动态:OpenAI的o1为何改变了AI监管规则
就在几天前,OpenAI向全世界展示了其最新的旗舰生成模型o1。作为一个“推理”模型,o1在回答问题之前会花更长的时间“思考”,将问题分解并自我检查答案。
o1有许多不能胜任的事情,OpenAI自己也承认这一点。但在某些任务上,比如物理和数学,o1表现出色,尽管它的参数量并不一定比OpenAI以前的顶级模型GPT-4o多。(在AI和机器学习领域,“参数”通常以数十亿计,大致对应于模型解决问题的能力。)
这对AI监管具有重要意义。
例如,加利福尼亚州提议的SB 1047法案对开发成本超过1亿美元或使用超过一定计算能力训练的AI模型提出了安全要求。然而,像o1这样的模型表明,提升模型性能并不只有扩大训练计算资源一条路。
Nvidia研究经理Jim Fan在X上的一篇帖子中推测,未来的AI系统可能会依赖小型、易于训练的“推理核心”,而非近期流行的训练密集型架构(如Meta的Llama 405B)。他指出,最近的学术研究表明,小型模型如o1在有更多时间思考问题时,可以远超大型模型。
因此,政策制定者将AI监管措施与计算能力挂钩是不是短视了呢?Cohere AI初创公司研究实验室负责人Sara ...
在 iOS 18 中个性化 iPhone 主屏幕?我有三种方法!
随着 iOS 18 的发布,苹果将 iPhone 的自定义功能提升到了一个新高度。此前,你可以轻松地在主屏幕上添加小组件、重新排列页面、应用自己的壁纸,最近还能定制锁屏。而高级用户则下载了一些应用,通过 iOS 快捷指令自定义图标,甚至使用图标设计工具或从 Pinterest、Google 等平台找到的图片制作自己的图标。
然而,在 iOS 18 中,你可以通过内置工具将所有图标更改为新的配色方案。
你还可以根据自己的喜好随意排列图标和小组件,它们不再需要彼此紧挨在网格中。这样,你可以选择围绕壁纸排列图标,或者只将图标放置在屏幕底部。
虽然随着苹果不断推出新的选项,系统的自定义功能变得有些复杂,但 iOS 18 提供了比以往任何版本更强的用户界面外观和感觉的控制权。
现在,只需在 iPhone 的主屏幕上长按,你就可以点击左上角的“编辑”按钮,进入新的自定义模式。在这里,你可以添加小组件、编辑主屏幕页面,或选择一个新的选项“自定义”,配置主屏幕图标和小组件的颜色和阴影。
iOS 18 为图标提供了四种选项:标准的浅色和深色模式,以及自动模式(夜幕降临时从浅色切换到深色),还有全新的“ ...
iOS 18 已经发布:速看新功能
苹果最新的软件更新iOS 18今天开始向所有iPhone用户推送。虽然AI技术在此次升级中备受期待,但Apple Intelligence功能并未包含在此次发布中。苹果表示,它将在iOS 18.1中推出Apple Intelligence功能,首先在美国发布,随后将在未来几个月内逐步向更多全球市场推出。
在iOS 18中,重点是个性化功能,包括自定义图标、重新设计的控制中心以及支持锁定和隐藏应用。
用户将能够在屏幕网格中任意放置图标或将它们放大,放大会隐藏文字标签,从而为iOS主屏幕提供更多控制。这个改动尤其吸引Z世代用户,特别是那些在iOS 14推出自定义图标时就迅速采纳这一功能的用户。用户不仅可以切换到暗黑模式或使用自己选择的颜色来自定义图标,第三方应用开发者也将能够发布自定义图标,充分利用这一功能。
一些开发者可能在第一天就准备好了更新,而另一些仍在进行图标更新的工作。
iOS的控制中心也进行了重大改版,通过在主屏幕上向下滑动可轻松访问常见功能。
默认情况下,控制中心现在有四页,分别是收藏、音乐控制、家庭和连接性。连接性包括Wi-Fi、蓝牙、个人热点等功能。所有内容在新控制中心 ...
OpenAI推出o1,一个能够自我事实核查的模型
ChatGPT的开发者OpenAI宣布了其下一次重大产品发布:一个代号为“Strawberry”(草莓)的生成式AI模型,正式名称为OpenAI o1。
更准确地说,o1实际上是一个模型家族。周四,两个版本将在ChatGPT和OpenAI的API中提供:o1-preview和o1-mini,后者是一个更小、更高效、专注于代码生成的模型。
要在ChatGPT客户端中使用o1,需要订阅ChatGPT Plus或Team版本,目前镜像站已经获得访问权限。企业和教育用户将在下周初获得访问权限。
o1聊天机器人的体验目前相当基础。与其前身GPT-4o不同,o1尚不能浏览网页或分析文件。该模型确实具有图像分析功能,但已被禁用,等待进一步测试。此外,o1有速率限制;目前,o1-preview每周限30条消息,o1-mini限50条。
另一个缺点是,o1非常昂贵。在API中,o1-preview的费用是每百万输入token15美元,每百万输出token60美元。与GPT-4o相比,输入成本是其3倍,输出成本是其4倍。(token是原始数据的单位;一百万token约等于75万字。)
OpenAI表示计划 ...
苹果iPhone 16发布会预期:AI、Pro升级、更大的手表
苹果将于9月9日在加州库比蒂诺举行iPhone 16发布会,发布会将在YouTube、Apple TV和苹果官网进行直播。
全系AI,需要强大处理器苹果智能(Apple Intelligence)需要强大的处理器支持。过去几年,苹果的策略是在基础款iPhone上使用上一代的顶级处理器,并为Pro机型引入新的更强大芯片。目前只有iPhone 15 Pro的A17 Pro处理器支持Apple Intelligence,但有传言称所有iPhone 16机型都将配备新的A18芯片。除此之外,我们还期待看到新的Apple Watch和新的AirPods系列产品。
iPhone 16换新相机布局今年主要的iPhone 16机型将有新配色,背面设计也略有不同。如果泄露的模型机属实,相机模组将改为像iPhone 12和iPhone X那样垂直排列两个镜头,而不是自iPhone 13以来使用的对角线布局。
垂直镜头布局将更好地支持景深空间视频的拍摄,方便在Vision Pro上观看。尽管没有迹象表明我们会看到Vision Pro本身的更新,但希望能有一些东西让消费者对苹果的混合现实技术保持兴趣。
据苹果 ...
为什么 AI 拼不出 "strawberry"
在单词 “strawberry” 中,字母 “r” 出现了多少次?根据 GPT-4 和 Claude 等强大的 AI 产品,答案是两次。
大型语言模型 (LLM) 可以在几秒钟内写出论文并解决方程式。它们可以比人类打开一本书还快地综合处理 TB 级的数据。然而,这些看似无所不知的 AI 有时会惨败,以至于这种失误会成为一个迷因,不过我们都庆幸,或许在我们必须向新的 AI 霸主俯首称臣之前,还有时间。
大型语言模型无法理解字母和音节的概念,这反映了一个我们经常忘记的更大的事实:这些东西没有大脑。它们不像我们那样思考。它们不是人类,甚至不是特别像人。
大多数 LLM 都构建在 Transformer 之上,Transformer 是一种深度学习架构。Transformer 模型将文本分解为标记,这些标记可以是完整的单词、音节或字母,具体取决于模型。
阿尔伯塔大学 AI 研究员兼助理教授 Matthew Guzdial 告诉 TechCrunch:”LLM 基于这种 Transformer 架构,值得注意的是,它实际上并不是在阅读文本。当你输入一个提示时,它会被转换成一种编码。当它看到单词 ...
本周人工智能:人工智能不是世界末日,但仍然有很大的危害
本周在人工智能领域,一项新研究表明,生成式人工智能并没有那么有害——至少不是那种世界末日般的有害。
在提交给计算语言学协会年会的一篇论文中,来自巴斯大学和达姆施塔特大学的研究人员认为,像Meta的Llama系列模型这样的模型如果没有明确的指示,就无法独立学习或获得新技能。
研究人员进行了数千次实验,以测试几个模型完成他们以前没有遇到过的任务的能力,比如回答有关超出其训练数据范围的主题的问题。他们发现,尽管模型可以表面上遵循指令,但它们无法自己掌握新技能。
“我们的研究表明,对于一个模型会自行做一些完全出乎意料的、创新的、有潜在危险的事情的担忧是没有根据的,”巴斯大学计算机科学家、该研究的合著者Harish Tayyar Madabushi在一份声明中说。”认为这种人工智能是对人类的威胁的普遍观点阻碍了这些技术的广泛采用和发展,同时也转移了我们需要关注的真正问题的注意力。”
这项研究存在一些局限性。研究人员没有测试OpenAI和Anthropic等供应商最新和最强大的模型,而且对模型进行基准测试往往是一门不精确的科学。但这项研究远非第一个发现当今的生成式人工智能技术并不会威胁到人类,而且 ...
Qwen2-Math:人工智能数学天才的新时代
阿里云Qwen团队推出了Qwen2-Math系列大型语言模型,专门用于解决复杂的数学问题。
这些新模型建立在现有的Qwen2基础之上,在解决算术和数学挑战方面表现出色,超越了以前的行业领导者。
Qwen团队使用了一个庞大而多样化的数学专业语料库来打造Qwen2-Math。该语料库包括丰富的高质量资源,如网络文本、书籍、代码、考题以及Qwen2自己生成的合成数据。
通过对英文和中文数学基准测试(包括GSM8K、Math、MMLU-STEM、CMATH和高考数学)的严格评估,Qwen2-Math展现了其卓越的能力。值得注意的是,其旗舰模型Qwen2-Math-72B-Instruct在各种数学任务中的表现超过了GPT-4o和Claude 3.5等专有模型。
Qwen团队指出:”Qwen2-Math-Instruct在同等规模的模型中取得了最佳性能,RM@8的表现优于Maj@8,特别是在1.5B和7B模型中。”
这种卓越的性能归功于在开发过程中有效地实施了特定于数学的奖励模型。
Qwen2-Math在2024年美国邀请数学考试(AIME)和2023年美国数学竞赛(AMC)等具有挑战性的数学 ...
本周人工智能要闻:OpenAI人才流失困境
本周人工智能界的重大新闻是OpenAI又失去了一位联合创始人。
在ChatGPT(OpenAI的AI驱动聊天机器人平台)开发中发挥关键作用的John Schulman离开了公司,加入了竞争对手Anthropic。Schulman在X平台上宣布了这一消息,称他的决定源于希望更深入地专注于AI对齐(确保AI按预期行为的科学),并从事更多实际的技术工作。
但不禁让人猜测,Schulman离职的时机是否别有用意,因为它恰逢OpenAI总裁Greg Brockman请长假至年底。
就在Schulman宣布离职的同一天,OpenAI透露计划改变今年DevDay活动的形式,选择一系列巡回开发者交流会,而非举办一场盛大的一日会议。一位发言人告诉TechCrunch,OpenAI不会在DevDay期间发布新模型,这暗示公司目前旗舰产品GPT-4的继任者研发进展缓慢。(英伟达Blackwell GPU的延迟可能会进一步放缓进度。)
OpenAI是否陷入困境?Schulman是否看到了不祥之兆?无疑,Sam Altman帝国的前景比一年前黯淡许多。
公关专家兼科技评论家Ed Zitron最近在他的通讯中概述 ...
Fomepay跑路?小心别踩坑!
最近有消息说fomepay和fomecard这两个虚拟卡平台跑路了,我看了一下,发现客服确实都不回消息了。大家要注意了,这些海外的虚拟卡平台还是有跑路风险的。咱们国内用户由于没有visa、master这类国际银行卡,订阅国外服务的时候,很多时候只能用虚拟卡。如果这些平台跑路了,我们就麻烦了。
我还是建议大家使用Wildcard这样的国内虚拟卡平台,相对更稳定、更安全一些。毕竟是国内公司,有实体运营地址,心里也更有底。而且wildcard的提现速度也很快,余额可以直接秒到支付宝,非常方便。相比之下,fomecard和fomepay都要经过人工客服,效率低不说,注册时连个认证都不需要,总感觉不太正规。
WildCard能干什么?怎么开卡注册?大家可以点击:轻松订阅海外软件服务以及WildCard虚拟信用卡介绍
我个人是一直在使用wildcard,之前也登陆过fomepay,PC端的页面做的就是和移动端似的,一点不专业也没有诚意。
PS:如果需要使用ChatGPT Plus或者Claude Pro,现在不推荐直接开通或者使用Wildcard平台的随心用,价格都比较贵,现在推荐镜像站,只需要前 ...