CentOS(Linux)安装KETTLE教程 并配置执行定时任务

CentOS(Linux)安装KETTLE教程 并配置执行定时任务KETTLE—CENTOS安装手册

1,首先是安装jdk,并设置环境变量

采用yum安装可不设置环境变量

2,下载kettle

https://sourceforge.net/projects/pentaho/files/Data%20Integration/

请选择我们当前工作的版本7.0

选择下载pdi-ce-7.0.0.0-25.zip

1.png

可以使用如下命名直接下载

wget -c --output-document=pdi-ce-7.0.0.0-25.zip https://nchc.dl.sourceforge.net/project/pentaho/Data%20Integration/7.0/pdi-ce-7.0.0.0-25.zip

3,使用unzip命令对这个压缩包进行解压

unzip pdi-ce-7.0.0.0-25.zip -d "/opt/kettle"

4,解压后给予相应文件可执行权限

进入到/opt/kettle/data-integration

授予 *.sh +x权限 即可执行权限

2.png

5,执行转换

编写测试转换,执行如下命令即可

/opt/kettle/data-integration/pan.sh -file=/opt/kettle/ktr/test/tset.ktr log=log.log

6,执行job

/opt/kettle/data-integration/ kitchen.sh -file=/opt/kettle/ktr/test/tset.job log=log.log

job和ktr的路径变量问题需要注意,也可以直接写绝对路径

7,配置定时任务

7.1,如果是转换文件需要定时

可以按照如下方法操作,创建一个文件 test.sh

在这个文件里写入如下语句

export JAVA_HOME=XXXXX

export CLASSPATH=.:$JAVA_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$PATH

/opt/kettle/data-integration/pan.sh -file=/opt/kettle/ktr/test/tset.ktr log=log.log ~data +%y%m%d~

然后给这个文件可执行权限 +x

然后运行 crontab –e 编辑定时任务

*/10 * * * * bash /home/etl/ schedule.sh表示每隔10分钟执行一次schedule.sh

然后保存,运行crontab–l查看定时任务是否已载入

运行systemctl restartcrond重启定时任务,运行service crond status查看crontab服务状态

7.2,如果是job需要定时

如果我们需要执行的是一个job,则可不必这样,直接在job里设置定时参数即可



如果您觉得本文章对您有用,也为了更好的运营博客,您可以点击这里捐助

评论 抢沙发

昵称 (必填) 邮箱 (必填)
表情
  1. #1

    来自kiki 回复给的评论 (2017-08-22 10:44:56) 回复
    据我所知,国内有款ETL调度监控工具TaskCTL,支持kettle还不错。可以跨平台分布式调度kettle。 Linux/Windows端的kettle都可以调。包括自动定时/排程,人工干预等调度方式。好像还没有一款软件能在图形监控上超过它,肯定比起其它的监控方案强多了。