文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

一篇文章掌握 FTP 和本地文件系统的桥梁 -CurlFtpFS

2024-12-02 15:36

关注

本文转载自微信公众号「明哥的IT随笔」,作者 IT明哥。转载本文请联系明哥的IT随笔公众号。

大家好,我是明哥!

本片博文是 “基于 FTP 状态文件检测结果触发 JENKINS 数据同步作业” 系列文章的最后一篇,我们来看下 FTP 和本地文件系统的桥梁 - CurlFtpFS.

1 背景回顾

某客户现场,每天都会批量生成大量 CSV 文件存放到 FTP 系统,这些 CSV 文件需要导入到大数据平台 HIVE 数仓中做后续离线分析,且 HIVE 数仓中的离线分析作业目前是使用 JENKINS 来调度的。

由于这些 CSV 文件是每天都会生成,且文件数比较多数据量也比较大,初步计划使用 DATAX 来导入 FTP 上的 CSV 文件。

但在调度系统 JENKINS 中,如何检测 ftp 上的 csv 文件是否 ready,并及时触发 DATAX 导入作业,成为了一个问题。

为探索和验证 JENKINS 中 FTP 文件的检测和触发机制,笔者基于 vsftpd 搭建了 FTP 服务器,并通过 CurlFtpFS 挂载了远程 FTP 目录到本地文件系统。

以下是正文。

2 curlftpfs 与 FUSE 简介

CurlFtpFS 是一个基于 libcurl 提供对远程 FTP 节点上文件系统的访问功能的用户态文件系统,可以让用户像访问本地文件系统一样去访问远程 ftp 节点的文件系统。

所谓 FUSE (Filesystem in Userspace),即用户态文件系统,是指完全在用户态而不是内核态实现的文件系统,其底层由 Linux 通过内核模块进行支持:

fuse-architecture

fuse

fuse主要由三部分组成:FUSE 内核模块、用户空间库 libfuse 以及挂载工具fusermount:

挂载工具:实现对用户态文件系统的挂载;

现在很多文件系统,出于易用性等各种考量因素,都提供了 FUSE 的使用方式,比如云原生分布式文件系统 JuiceFS,和云原生数据编排框架/基于内存的分布式文件系统 Alluxio,都不约而同提供了 FUSE 服务:

alluxio-fuse

juicefs-fuse

3 curlftpfs 的安装

4 临时挂载远程 FTP 目录到本地文件系统

可以使用命令 curlftpfs,临时挂载远程 ftp 目录到本地文件系统:

5 永久挂载远程 FTP 目录到本地文件系统

使用命令 curlftpfs 挂载的 FTP 目录,在服务器重启后就失效了,如果要实现永久挂载,需要更改文件 /etc/fstab,添加以下条目:

6 最终方案思路概述

 

 

来源:明哥的IT随笔内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯