这些天在家里没有办法上网,所以笔记可能会隔几天记录一下。
上一次记录了一下简单的表对表的数据流转。那么我们这次使用excel来作为数据来源做一次导入。
如果看过笔记二中的表对表数据迁移,那么这回会非常轻松的理解数据流转。
好了,废话就不多说了。开始这一次的笔记实录吧!
需要通过Excel进行数据获取,需要准备一个Excel,因为kettle对excel的支持不是很好,所以支持2003之前的格式。我们创建一个文件,如图:
创建一个新的transformation,然后拖拽出我们要使用的excel输入,如图:
然后对Excel输入进行设置,首先是对文件进行设置,选择浏览,找到文件,单击添加既可,如图:
那么文件设置完成,接下来是制定工作表,也就是excel中的sheet,之前准备的数据放在了sheet1中,所以选择sheet1即可。如图:
工作表设置完,还有最后一项设置,那就是字段设置,通过这项设置指定哪些字段作为输入来源。如图:
单击“获取来自……”即可获取excel中所选工作表的所有字段,之后的筛选工作,手动完成即可。
接下来是数据终点--表输出,通过表输出来完成数据的落地。拖拽表输出。第一项工作是数据库连接的新建,因为是新创建的transformation,所以只能重新创建数据库连接。如图:
然后设置表输出其他配置。如图:
细心的人可以发现,这次的设置和上一次的不大一样。是因为这一次我没有在mysql库中建立目标表,而是直接指定目标表的名称,然后单击SQL通过kettle自动生成SQL的执行完成目标表的创建。一般自动生成的SQL语句比较粗糙,所以需要修改一下,然后单击执行即可,执行结束后会弹出运行结果,如果正确如上图所示,显示一个SQL语句,提示已经执行了。如果错误会抛出异常,有兴趣可以尝试一下,错误的SQL语句。
创建成功了之后,接下来的步骤就一样了,如图:
字段配置成功后,确定完成表输出的配置。
我们查看一下我们的数据表,如图:
然后选择执行转换,如图:
启动后界面,如下:
一切ok,那么查看一下数据库表中数据吧!如图:
好了,这样就完成了从excel到表中的转换。
这一次就记录这些。