永发信息网

怎么将mysql数据导入hadoop

答案:1  悬赏:60  手机版
解决时间 2021-03-08 22:52
怎么将mysql数据导入hadoop
最佳答案
通过Map/Reduce进行批处理递送到Apache Hadoop仍然是中枢环节。,但随着要从“超思维速度“分析方面获取竞争优势的压力递增,因此Hadoop(分布式文件系统)自身经历重大的发展。科技的发展允许实时查询,如Apache Drill,Cloudera Impala和Stinger Initiative正脱颖而出,新一代的资源管理Apache YARN 支持这些。

为了支持这种日渐强调实时性操作,发布一个新MySQL Applier for Hadoop(用于Hadoop的MySQL Applier)组件。它能够把MySQL中变化的事务复制到Hadoop / Hive / HDFS。Applier 组件补充现有基于批处理Apache Sqoop的连接性。

这个组件(MySQL Applier for Hadoop)的复制是通过连接MySQL主服务,一旦二进制日志被提交,就读取二进制日志事务,并且把它们写到HDFS.

这个组件使用libhdfs提供的API,一个C库操作HDFS中的文件。这库由Hadoop版本预编译生成的。

它连接MySQL主服务读二进制日志,然后提取发生在主服务上的行插入事件,解码事件,提取插入到行的每个字段的数据,并使用满意的处理程序得到被要求的格式数据。把它追加到HDFS 中一个文本文件。

数据库被映射为单独的目录,它们的表映射为子目录,保存在数据仓库目录。每个表的数据被写到Hive/ HDFS中文本文件(称为datafile1.txt)。数据可以用逗号格式分隔;或其他格式,那可用命令行参数来配置的。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
金灵中路/金灵中路西十七巷(路口)地址在什么
【耍酷】有没有“耍酷”词语,耍酷是神马意思
形容天气寒冷的四字词语
我的钱 用别人的身份证和存着 存的 密码我设
买二手车,签协议 还能过户吗?
福奈特河北廊坊新华路店在哪里啊,我有事要去
hold的词义及用法关于爱华仕箱包的广告词,觉
城市康乐中心地址在什么地方,想过去办事
我国有哪些有名的瀑布
我和男友刚在一起没几天,他92,我身份证上94
唱戏人寿命
日本水素杯生成水素水给小孩儿兑奶喝好吗?
2010年7月27日英文怎么写
拉布拉多犬黑色的纯还是黄色的纯
夜空中最亮的星法语版音译
推荐资讯
什么是品格?
名胜古迹的地方有哪些
点金胜手高潮背景音乐
做湘商所现货原油总是亏?为什么呢?
世界著名长跑运动员有哪些?
试述打桩顺序有几种?如何确定合理的打桩顺序
索尼Xperia XZ Premium怎么刷机
成都有哪些旅行社
宝地二手房我想知道这个在什么地方
地下城怎么倒卖药水
横汀地址在哪,我要去那里办事
赵丽颖和景甜谁比较漂亮
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?