索引只是表格特定列上的指针.创建索引意味着在表的特定列上创建指针.其语法如下 :
CREATE INDEX index_name ON TABLE base_table_name (col_name, ...) AS 'index.handler.class.name' [WITH DEFERRED REBUILD] [IDXPROPERTIES (property_name = property_value, ...)] [IN TABLE index_table_name] [PARTITIONED BY (col_name, ...)][ [ ROW FORMAT ...] STORED AS ... | STORED BY ... ] [LOCATION hdfs_path] [TBLPROPERTIES (...)]
让我们举个例子来理解索引的概念.使用我们之前使用的相同员工表,其中包含字段Id,Name,Salary,Designation和Dept.在 salary <上创建名为 index_salary 的索引/b> 员工表的列.
以下查询创建索引 :
./hcat –e "CREATE INDEX inedx_salary ON TABLE employee(salary) AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';"
这是指向薪水列的指针.如果修改了列,则使用索引值存储更改.
以下语法用于删除索引和减号;
DROP INDEX< index_name> ON <table_name>
以下查询删除索引index_salary :
./hcat -e"DROP INDEX index_salary ON employee;"