Tajo的配置基于Hadoop的配置系统.本章详细介绍了Tajo配置设置.
Tajo使用以下两个配置文件 :
catalog-site.xml : 目录服务器的配置.
tajo-site.xml : 其他Tajo模块的配置.
分布式模式设置在Hadoop分布式文件系统(HDFS)上运行).让我们按照步骤配置Tajo分布式模式设置.
此文件位于@ b>/path/to/tajo/conf 目录,并充当其他Tajo模块的配置.要以分布式模式访问Tajo,请将以下更改应用于"tajo-site.xml".
<property> <name>tajo.rootdir</name> <value>hdfs://hostname:port/tajo</value> </property> <property> <name>tajo.master.umbilical-rpc.address</name> <value>hostname:26001</value> </property> <property> <name>tajo.master.client-rpc.address</name> <value>hostname:26002</value> </property> <property> <name>tajo.catalog.client-rpc.address</name> <value>hostname:26005</value> </property>
Tajo使用HDFS作为主存储类型.配置如下,应添加到"tajo-site.xml".
<property> <name>tajo.rootdir</name> <value>hdfs://namenode_hostname:port/path</value> </property>
如果要自定义目录服务,请复制 $ path/to/Tajo/conf/catalogsite.xml.template 到 $ path/to/Tajo/conf/catalog-site.xml 并根据需要添加以下任何配置.
例如,如果您使用"Hive catalog store"来访问Tajo,那么配置应该类似于以下 :
<property> <name>tajo.catalog.store.class</name> <value>org.apache.tajo.catalog.store.HCatalogStore</value> </property>
如果您需要存储 MySQL 目录,请应用以下更改和减号;
<property> <name>tajo.catalog.store.class</name> <value>org.apache.tajo.catalog.store.MySQLStore</value> </property> <property> <name>tajo.catalog.jdbc.connection.id</name> <value><mysql user name></value> </property> <property> <name>tajo.catalog.jdbc.connection.password</name> <value><mysql user password></value> </property> <property> <name>tajo.catalog.jdbc.uri</name> <value>jdbc:mysql://<mysql host name>:<mysql port>/<database name for tajo> ?createDatabaseIfNotExist = true</value> </property>
同样,您可以在配置文件中注册其他Tajo支持的目录.
默认情况下,TajoWorker将临时数据存储在本地文件系统中.它在"tajo-site.xml"文件中定义如下 :
<property> <name>tajo.worker.tmpdir.locations</name> <value>/disk1/tmpdir,/disk2/tmpdir,/disk3/tmpdir</value> </property>
要增加每个工作人员资源的运行任务的容量,请选择以下配置 :
<property> <name>tajo.worker.resource.cpu-cores</name> <value>12</value> </property> <property> <name>tajo.task.resource.min.memory-mb</name> <value>2000</value> </property> <property> <name>tajo.worker.resource.disks</name> <value>4</value> </property>
要使Tajo工作人员以专用模式运行,请选择以下配置 :
<property> <name>tajo.worker.resource.dedicated</name> <value>true</value> </property>