文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

使用深度学习为您的图片构建功能强大的图像搜索引擎

2024-12-03 01:04

关注

几天前,我有一种想要回顾一张我记忆犹新的旧照片的愿望,但我不知道在哪里可以找到…自从这张照片被拍摄后,我换了两次手机,换了一次笔记本电脑,我很确定我当时已经通过Messenger把它发给了某人,但是是谁呢?如果能用一个简单的描述性查询搜索我所有的图片并找到它,那该有多方便啊!…

计算机视觉的最新进展提高了图像嵌入(密集矢量表示)的相关性,使用最近的剪辑模型,为我的本地图片实现类似Google的图像搜索现在很容易实现。

无需深入研究细节(更多信息,请参阅博客帖子和论文:https://openai.com/blog/clip/),Clip是一个神经网络,旨在通过自然语言监督来学习图像特征。基本上,它使用互联网上带有相关字幕的公共图像,将文本嵌入类似Bert的语言模型,并将图像嵌入视觉转换器。请注意,所使用的技术可以应用于其他NLP和CV模型体系结构。利用多个图像/文本嵌入对,可以通过批量负对比训练来微调视觉和文本嵌入模型,类似于在信息检索的NLP领域中可以做的事情。基本上,目标是使图像嵌入与其关联的文本嵌入相对应(点积),并且与其他图像的所有(1)不同。 

剪辑通常用于“零镜头”分类;给定图像和字幕列表,它会推断图像的最佳字幕是什么。在上面的例子(2)中,与“飞机的照片”、“鸟的照片”、“汽车的照片”相比,“狗的照片”是最好的图片说明。…

我对图像搜索引擎的想法(这里并不新鲜)是颠覆这一点,而不是基于图像对字幕进行分类,而是基于文本查询对图像进行分类。该过程将如下所示:

这个过程以及一些额外的特性是在我的Github存储库中实现的:https://github.com/ManuelFay/ImageSearcher. https://github.com/ManuelFay/ImageSearcher

在索引阶段,代码使用oslibrary查找给定目录和子目录中的所有图片,使用转换器和Pickle库嵌入和存储矢量化表示。在运行时,将加载酸洗过的嵌入,并根据嵌入的查询进行匹配,然后返回排名第n位的图像。提供了Flask/Gunicorn API,以便能够高效地使用具有外部接口的搜索引擎。还提供了一个简单的Google Image Search,类似于Vue.js构建的Web界面。

示例

为了获取大量的图片,我从Facebook下载了我的Messenger档案,获得了过去几年里我发送和接收的大约1万张图片。

搜索引擎允许进行非常描述性的查询。排名靠前的图像排在第一位。请注意,这些图片都是从我的大约10,000张本地图片中提供的,因此选项池是有限的。

元查询也是可能的。在这里,我们请求无人机拍摄的照片:

这是一个很快的下午项目,但剪辑模型的精确度给我留下了深刻的印象。要自己测试它,请使用https://github.com/ManuelFay/ImageSearcher.中的代码欢迎对改进和额外功能的贡献! https://github.com/ManuelFay/ImageSearcher 

 

来源:磐创AI内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯