乡村销客
乡村销客官网 : http://www.vilsale.com
乡村销客是面向化肥行业的企业互联网营销工具。通过“移动应用+云计算+应用市场”的互联网领先技术,帮助化肥生产销售企业快速实现
- 移动化市场营销及客户拜访,
- 解决调度发运响应不畅
- 客户账户对账不准等问题,
- 帮助肥料企业营销及客户管理 ”。
乡村销客基于软件即服务的互联网理念,创建国内第一个专注 肥料行业的SAAS平台 ,为肥料企业打造性价比最高的企业互联网营销工具。
———–这是广告结束的分割线————————–
datax
dataxWIKI : https://github.com/alibaba/DataX/wiki/DataX-Introduction
hdfswriter : https://github.com/alibaba/DataX/blob/master/hdfswriter/doc/hdfswriter.md
hive
1 进入 amb5 或者amb6
2 执行 hive 命令 启动 hive
3 写sql语句
1 | show databases; |
mysql—>hive
mysql-hdfs.json 配置案例
1 | { |
参数说明
- defaultFS
描述:Hadoop hdfs文件系统namenode节点地址。格式:hdfs://ip:端口;例如:hdfs://127.0.0.1:9000
- fileType
描述:文件的类型,目前只支持用户配置为”text”或”orc”。
text表示textfile文件格式
orc表示orcfile文件格式
- path
描述:存储到Hadoop hdfs文件系统的路径信息,HdfsWriter会根据并发配置在Path目录下写入多个文件。为与hive表关联,请填写hive表在hdfs上的存储路径。例:Hive上设置的数据仓库的存储路径为:/user/hive/warehouse/ ,已建立数据库:test,表:hello;则对应的存储路径为:/user/hive/warehouse/test.db/hello
- writeMode
描述:hdfswriter写入前数据清理处理模式:
append,写入前不做任何处理,DataX hdfswriter直接使用filename写入,并保证文件名不冲突。
nonConflict,如果目录下有fileName前缀的文件,直接报错。
- compress
描述:hdfs文件压缩类型,默认不填写意味着没有压缩。其中:text类型文件支持压缩类型有gzip、bzip2;orc类型文件支持的压缩类型有NONE、SNAPPY(需要用户安装SnappyCodec)。
类型转换
目前 HdfsWriter 支持大部分 Hive 类型,请注意检查你的类型。
下面列出 HdfsWriter 针对 Hive 数据类型转换列表:
DataX 内部类型 | HIVE 数据类型 |
---|---|
Long | TINYINT,SMALLINT,INT,BIGINT |
Double | FLOAT,DOUBLE |
String | STRING,VARCHAR,CHAR |
Boolean | BOOLEAN |
Date | DATE,TIMESTAMP |
步骤
1 建表
2 配置 json
3 执行导入
4 hive 查看测试数据
定时任务
会进入已有crontab文件编辑界面,继续增加定时任务即可,本示例增加以下内容,并保存
1 | 0,10,20,30,40,50 * * * * python /opt/local/datax/bin/datax.py /opt/local/datax/job/mysql.json >>/opt/logs/dataxlog.`date +\%Y\%m\%d\%H\%M\%S` 2>&1 |
1 | python /opt/local/datax/bin/datax.py /opt/local/datax/job/mysql.json |
查看该用户下的crontab服务是否创建成功, 用 crontab -l 命令
分 小时 日 月 星期 命令
0-59 0-23 1-31 1-12 0-6 command (取值范围,0表示周日一般一行对应一个任务)
1 | 每天执行一次 |