Hugging Face 推出 Idefics2 视觉语言模型
Hugging Face 公司宣布推出 Idefics2,这是一个多功能模型,能够理解和生成基于图像和文本的文字回复。该模型为回答视觉问题、描述视觉内容、根据图像创作故事、文档信息提取,甚至根据视觉输入执行算术运算树立了新的标杆。
Idefics2 仅有 80 亿个参数,其开放许可证(Apache 2.0)带来的多功能性以及显著增强的光学字符识别(OCR)功能,使其超越了前代产品 Idefics1。
该模型不仅在可视化问题解答基准测试中表现出色,而且在与 LLava-Next-34B 和 MM1-30B-chat 等规模更大的同类产品的竞争中也毫不逊色:
Idefics2 最吸引人的地方在于它从一开始就与 Hugging Face 的 Transformers 相集成,从而确保可以轻松地对各种多模式应用进行微调。对于那些急于深入研究的人,Hugging Face Hub 上提供了可供实验的模型。
Idefics2 的一个突出特点是其全面的训练理念,它融合了公开可用的数据集,包括网络文档、图像字幕对和 OCR 数据。此外,它还引入了被称为 “熔炉 “的创新微调数据集,将 50 个精心策 ...
OpenAI现已普遍提供带有视觉应用程序接口的GPT-4 Turbo
OpenAI宣布,其功能强大的GPT-4 Turbo with Vision模型现已通过公司的API全面推出,为企业和开发人员将高级语言和视觉功能集成到其应用程序中开辟了新的机会。
继去年 9 月首次发布 GPT-4 的视觉和音频上传功能,以及 11 月在 OpenAI 开发者大会上发布 GPT-4 Turbo 涡轮增压模型之后,GPT-4 Turbo with Vision 也在 API 上推出。
GPT-4 Turbo 可显著提高速度,扩大输入上下文窗口,最多可容纳 128,000 个令牌(相当于约 300 页),并提高开发人员的经济承受能力。
一个关键的增强功能是 API 请求能够通过文本格式 JSON 和函数调用利用模型的视觉识别和分析功能。这样,开发人员就可以生成 JSON 代码片段,在连接的应用程序中自动执行操作,如发送电子邮件、购物或在线发布。不过,OpenAI 强烈建议在采取影响现实世界的行动之前,先建立用户确认流程。
(PS:使用Wildcard享受不受网络限制的API调用,详情查看教程)
一些初创公司已经在利用 Vision 的 GPT-4 Turbo,其中包括Co ...
Wildcard重大更新!支持超20种订阅服务!OpenAI、OnlyFans……
近日,WildCard迎来重大更新,支持更多订阅服务!
订阅服务包括有:
AI
应用
粉丝
chatgpt
google play
onlyfans
cluade
apple store
patreon
midjourney
amazon
PIXIVFANBOX
github
microsoft
FANTIA
poe
twitter
DLSITE
suno
OVERLEAF
PERPLEXITY
CLOUDFLARE
heygen
ADOBE
ELEVENLABS
RUNWAY
与此同时,也有WildCard 独立服务,如API 随心用,ChatGPT 专用浏览器
API 随心用无需账户和绑卡,任意网络 直连 GPT-4/Claude 3,服务稳定,价格实惠。下图为站长本人使用截图
ChatGPT 专用浏览器
优选网络,GPT 专用
专门为访问 OpenAI 优选的家庭网络出口,确保您享受快速、稳定的连接。
无需配置,安装即用
浏览器简单易用,安装完成后无需任何配置即可使用。适合各类用户。
隐私保护,确保 ...
Stability AI推出12B参数Stable LM 2模型和更新的1.6B变体
Stability AI已推出其Stable LM 2语言模型系列的最新成员:一个120亿参数的基础模型和一个经过指令调优的变体。这些模型在七种语言上训练,包括英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语,训练数据达到了令人印象深刻的两万亿个标记。
120亿参数的模型旨在在强大的性能、效率、内存需求和速度之间找到平衡。它遵循了Stability AI之前发布的Stable LM 2 1.6B技术报告的既定框架。这一新版本扩展了公司的模型范围,为开发者提供了一个透明而强大的工具,用于用AI语言技术进行创新。
除了12B模型,Stability AI还发布了其Stable LM 2 1.6B模型的新版本。这个更新的1.6B变体在相同的七种语言上改善了对话能力,同时保持了极低的系统要求。
Stable LM 2 12B被设计为一个高效的开放模型,专为多语言任务量身定做,能在广泛可用的硬件上平稳运行。
据Stability AI称,这个模型能够处理通常只有大得多的模型才能完成的任务,这些大模型通常需要大量的计算和内存资源,比如大型的专家混合模型(Mixture-of-Experts, ...
微软人工智能在伦敦设立新中心,由前 Inflection 和 Deepmind 科学家乔丹-霍夫曼(Jordan Hoffmann)担任负责人
微软宣布为其新近成立的消费人工智能部门设立一个新的伦敦中心。该中心将由乔丹-霍夫曼(Jordan Hoffmann)领导,他是微软最近从备受瞩目的人工智能初创公司Inflection AI(微软去年投资了该公司)挖来的一名人工智能科学家和工程师。
这一消息是在微软首席执行官萨蒂亚-纳德拉(Satya Nadella)发布由Inflection AI创始人领导的新消费人工智能部门约三周后发布的,Inflection AI的创始人包括2014年被谷歌收购的人工智能公司Deepmind的联合创始人穆斯塔法-苏莱曼(Mustafa Suleyman)。
纳德拉当时表示,”Inflection 团队的几位成员 “也加入了微软新的人工智能部门(彭博社报道称,大部分成员实际上都加入了)。我们现在知道,霍夫曼就是其中之一,他曾是一名博士生,2020 年加入 Deepmind 担任研究科学家,后来跳槽到 Inflection AI,之后苏莱曼于 2022 年成立了这家初创公司,并开始从 Deepmind 和 Meta 挖人。在今天的一篇博文中,苏莱曼称霍夫曼是一位 “杰出的人工智能科学家和工程师”,苏莱 ...
OpenAI也过愚人节?错啦!他们来真的!
当地时间4月1日,OpenAI宣布,将从当日起逐步放开使用ChatGPT的注册要求,用户将无需再注册该服务。
虽然是在4月1日公布的消息,但这并不是一个愚人节玩笑。OpenAI在公告中写道:“我们的使命是让像ChatGPT这样的工具广泛可用,以便人们体验AI带来的好处。有来自185个国家的1亿多人每周使用ChatGPT来学习新知识、寻找创意灵感,并获得问题的答案。从今天开始,您无需注册即可使用ChatGPT。”
当然了,此次开放的仅仅是免注册使用ChatGPT 3.5,如果想要使用4.0,甚至是为了不久后即将到来的4.5或者5.0,可以升级订阅为PLUS用户,可以参考教程
(使用新的匿名窗口打开chat.openai.com已不需要注册)
不过,值得注意的是,未经注册的用户将失去一些注册用户的权利,例如保存或共享聊天记录和使用自定义指示。未经注册用户的聊天数据也会被默认进入ChatGPT的训练集,除非用户在“设置”中关闭该选项。OpenAI还指出,未经注册的ChatGPT版本将有“更加严格一些的内容政策”,但未对此进行详细说明。
或许是因为放开注册要求使得用户量激增,1日晚间,Ope ...
IPPR:800万英国职业面临因人工智能引发的“职业末日”风险
公共政策研究所(IPPR)的一份报告揭示了人工智能对英国就业市场可能产生的影响。研究警告说,一个迫在眉睫的“工作末日”正威胁着全国超过八百万的职业生涯,除非政府迅速介入采取行动。
报告确定了生成式人工智能采纳的两个关键阶段。第一波已经在进行中,占英国工人所执行任务的11%。像数据库管理和组织任务(如日程安排)这样的常规认知任务最有风险。
然而,在潜在的第二波中,人工智能可能处理高达59%的任务——影响到收入较高的工作和非常规认知工作,如创建数据库。
IPPR的高级研究员Bhargav Srinivasa Desikan表示:“我们可能会看到像撰稿人、平面设计师和个人助理等职位受到人工智能的严重影响。问题是我们如何引导技术变革,以便为新的就业机会、提高生产率和为所有人带来经济利益。”
“我们正处于一个转折点,政策制定者迫切需要制定战略,以确保我们的劳动市场适应21世纪,而不是让数百万人掉队。确保所有工人都从这些技术进步中受益,而不仅仅是大型科技公司,至关重要。”
IPPR为第二波的影响模拟了三种情景:
最坏情况:失去790万个工作岗位,没有GDP增长
一般情况:失去440万个工作岗位, ...
导演、音乐家、艺术家眼中的Sora第一印象
自从2月16日Sora发布的那个夜晚以来,多少人都在翘首以盼,期待能真正的用上Sora。但是OpenAI自己也懂,基于模型对齐问题、安全问题、推理算力问题等等,这玩意短期内,基本不可能放出来给大众用。当然了,等以后能够开发给大众使用的时候,鉴于它所需要的算力,一定是远超ChatGPT的,所以肯定会给PLUS用户使用,关于如何升级PLUS,可以查看这个教程.
为了维持热度,OpenAI天天在Tiktok上放一点新视频,来维持Sora的热度。
但是无一例外的是,这些视频,大部分都是他们自己生成的。并且,大部分的视频,审美都不太行。
但是刚刚有个好消息是,OpenAI 宣布,自2月份推出文生视频工具Sora以来,他们始终在与视觉艺术家、设计师、创意人士以及电影制作人等各界精英展开合作,共同探讨Sora如何助力他们的创作之旅。
OpenAI在官方声明中提到,尽管Sora仍有诸多方面有待完善,但他们已经目睹了这个模型如何神奇地将创意人员的构想转化为生动逼真的现实画面。
当你不复制旧的东西,而是将我们本来没有机会看到的新的、不可能的想法变为现实时,Sora 的力量最为强大。
- 保罗·特里 ...
AI 工具能检测到医生未发现的癌症征兆
一项 AI 工具已证明其能够侦测到人类放射科医师遗漏的癌症迹象。
这款名为 Mia 的 AI 工具在英国与 NHS 临床医生合作进行试点,分析了逾 10,000 名女性的乳房 X 光检查结果。
虽然大部分参与者没有癌症,但 AI 成功地标出了所有表现出乳腺癌症状的病例,以及额外的 11 个医生未发现的案例。在参与此次试验的 10,889 名女性中,仅有 81 名选择不接受 AI 系统的扫描复查。
AI 工具通过学习超过 6,000 个既往乳腺癌案例的数据集,掌握了与恶性肿瘤关联的微妙模式和影像标记。在对新病例的评估中,它以 81.6% 的准确率正确预测了癌症的存在,并有 72.9% 的准确率正确排除了癌症。
乳腺癌是全球女性中最普遍的癌症类型,每年有两百万新病例被诊断。尽管早期发现和改进的治疗方法提高了生存率,但许多患者在接受手术和放疗后还是会遭受如淋巴水肿等严重副作用。
研究人员目前正进一步开发 AI 系统,旨在预测患者在治疗后至多三年内的副作用风险。这将使医生能够为高风险患者提供个性化的护理方案,包括选择性治疗或额外的支持性措施。
研究团队打算在一个名为 Pre-Act 的临床试验 ...
ChatGPT又要更新了?GPT-5发布时间确定!
在K-Startup-OpenAI Match Day活动上,OpenAI CEO萨姆·奥特曼(Sam Altman)首次公开肯定了GPT-5的潜力。他指出,GPT-5不仅会带来显著的进步,更将在高级推理功能上实现一次前所未有的飞跃,打破外界对于其仅是渐进式提升的误解。
同时现场透露了关于 GPT-5 的更多细节和进展。
通过ChatGPT Plus教程 可以快速升级到ChatGPT Plus版本,后续也可以快速体验到GPT5的新功能,也可以一键升级到Plus。
GPT-5预计将成为一种真正的多模态模型,能处理包括文本、音频、图片、视频、深度数据甚至温度信息在内的各种数据类型,从而提供对世界的更广泛理解。
发布时间GPT-4自2023年5月发布以来已近一年,与此同时,包括Claude在内的其他大型模型也陆续推出了新版本。据悉,OpenAI计划在今年夏季发布GPT-5,期待其性能的大幅跃升。
AGI研发Altman透露,他和他的团队正全力投入到通用人工智能(AGI)的研发中,几乎无暇顾及外界其他事物。他认为,一旦成功实现AGI,将有可能解决包括能源短缺在内的全球性难题。为了支持AI技术 ...