文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

训练10亿张图片,Facebook新AI模型可能给计算机视觉带来革命

2024-12-03 09:38

关注

Facebook的研究人员推出了一种新的AI模型,该模型可以从网上任何未标记图像的中学习,这是一项突破,尽管该团队的研究仍处于早期阶段,但他们希望给计算机视觉领域带来一次“革命”。 

该模型被称为SEER(SElf-SupERvised),被馈入了10亿张公开可用的instagram图像,这些图像未经过手动标记。但是,即使没有通常在AI算法训练中使用的标签和注释,SEER仍能够自主地训练数据集,不断进行学习,并最终在诸如对象检测之类的任务上达到最高的准确性。 

图片来自Facebook AI

这种被称为自监督学习(self-supervised learning)的方法在AI领域已经很成熟:它由可以直接从给定信息中学习的系统组成,而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

自监督式学习近来引起了很多关注,因为这意味着需要手工标记数据的工作要少很得,这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时,自监督模型可以处理更大,更多样化的数据集。 

在某些领域,特别是自然语言处理中,该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。 

相反,计算机视觉尚未完全进入自监督的学习革命。正如Facebook AI Research的软件工程师Priya Gopal解释的那样,SEER是该领域的首创。她告诉ZDNet:“与现有的在ImageNet数据集上训练的计算机视觉的自监督模型相比,SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。” 

ImageNet是一个大规模数据库,包含研究人员标记的数百万张图片,并向较大的计算机视觉社区开放,以促进AI的发展。

该项目的数据库被Facebook的研究人员用作评估SEER性能的基准,他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。 

Goyal说:“通过仅对随机图像进行训练,SEER优于现有的自监督模型。这一结果表明,我们不需要像ImageNet这样的高度精选的数据集,对随机图像的自监督学习就可以产生非常高质量的模型。” 

随着自监督学习复杂度的提高,研究人员的工作并非没有挑战。在文本方面,AI模型的任务是为单词赋予含义。但是对于图像,该算法必须决定每个像素如何与一个概念相对应,同时考虑到其在不同图片中拍摄角度、视图和形状的差别。 

换句话说,研究人员需要大量数据,并且需要一个能够从这种复杂的信息池中推导出所有可能的视觉概念。  

为了完成此任务,Goyal和她的团队从Facebook AI在自监督学习中的现有工作中改编了一种新算法,称为SwAV,该算法将显示相似的图像聚集到单独的组中。科学家还设计了卷积网络,也就是一种深度学习算法,算法对人脑中神经元的连接模式进行建模,根据重要性分配给图像中的不同对象。 

至少可以说,借助instagram的10亿张图片的数据集,该系统的规模很大。Facebook的团队使用了具有32GB RAM的V100 Nvidia GPU,并且随着模型尺寸的增加,必须将模型放入可用的RAM中。但是Goyal解释说,进一步的研究将对确保计算功能适应新系统很有用。 

“随着我们在越来越多的GPU上训练模型,这些GPU之间的通信需要快速进行。可以通过开发软件来解决给定的内存和运行时间带来的挑战.”她说。 

尽管仍有许多工作要做,但是,在可以将SEER应用于现实世界的用例之前,Goyal认为不应低估该技术的影响。她说:“借助SEER,我们现在可以通过大量随机的互联网上的图像训练大型模型,在计算机视觉方面取得更大的进步。” 

“这一突破可以实现计算机视觉的自监督学习革命,类似于我们在自然语言处理文本中所看到的。” 

在Facebook内部,SEER可用于各种计算机视觉任务,从自动生成图像描述到帮助识别违反政策的内容。在公司外部,该技术还可用于图像和元数据有限的领域,例如医学成像。 

Facebook的团队呼吁开展更多工作,以将SEER推进到其下一阶段的开发。作为研究的一部分,该团队开发了一种基于PyTorch的全能库,用于自监督学习,称为VISSL,该库是开源的,鼓励更多的AI社区成员对该技术进行测试。

来源:雷锋网内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯