spark sql derby 替换成 mysql

栏目: 数据库 · 发布时间: 5年前

内容简介：hive和spark sql 默认用的都是derby，上篇文章说了，spark sql使用hive的配置来连接mysql，配置下来挺简单的，并且不需要启动hive2，复制hive主机点的配置hive-site.xml，到所有spark节点，#SPARK_HOME/conf目录下，不用做任何改变。

hive和spark sql 默认用的都是derby，上篇文章说了， hive怎么使用 mysql 做为元数据库 。

spark sql使用hive的配置来连接mysql，配置下来挺简单的，并且不需要启动hive

1，所有spark节点，创建mysql连接 java 包

# ln -s /usr/share/java/mysql-connector-java.jar /bigdata/spark/jars/

2，复制hive主机点的配置hive-site.xml，到所有spark节点，#SPARK_HOME/conf目录下，不用做任何改变。

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

 <property>
 <name>javax.jdo.option.ConnectionURL</name>
 <value>jdbc:mysql://10.0.0.237:3306/hive?createDatabaseIfNotExist=true</value>
 </property>

 <property>
 <name>javax.jdo.option.ConnectionDriverName</name>
 <value>com.mysql.jdbc.Driver</value>
 </property>

 <property>
 <name>javax.jdo.option.ConnectionUserName</name>
 <value>hive</value>
 </property>

 <property>
 <name>javax.jdo.option.ConnectionPassword</name>
 <value>Netjoy_123</value>
 </property>

 <property>
 <name>hive.exec.scratchdir</name>
 <value>/user/hive/tmp</value>
 </property>

 <property>
 <name>hive.metastore.warehouse.dir</name>
 <value>/user/hive/warehouse</value>
 </property>

 <property>
 <name>hive.querylog.location</name>
 <value>/user/hive/log</value>
 </property>

 <property>
 <name>hive.metastore.schema.verification</name>
 <value>false</value>
 </property>

</configuration>

如果启动hive报

MetaException(message:Hive Schema version 2.3.0 does not match metastore's schema version 1.2.0 Metastore is not upgraded or corrupt)

解决办法：

在所有hive节点，#HIVE_HOME/conf/hive-site.xml添加以下内容

<name>hive.metastore.schema.verification</name>

<value>false</value>

</property>

3，在hive创建数据库和表，然后通过spark-sql去查就知道是不是用了mysql了。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

增长黑客

Sean Ellis / 张溪梦 / 中信出版集团股份有限公司 / 2017-11-1 / CNY 59.00

脸谱网如何从默默无闻到坐拥二十几亿用户？爱彼迎、优步何以在短短时间估值超过百亿美元？领英怎样跨步成为全球领先的职业社交平台? 这些初创公司实现爆发式成长的共同奥秘就是增长黑客。增长黑客是硅谷当下热门的新商业方法论，其精髓在于通过快节奏测试和迭代，以极低甚至零成本获取并留存用户。作为最早提出“增长黑客”概念的理论先驱、带领Dropbox实现500%增长的实战领军......一起来看看《增长黑客》这本书的介绍吧!

码农工具