Как разбить таблицы athena на отдельные столбцы
У меня Афина таблицу с большим количеством столбцов, которое загружает данные из S3 ведро. Допустим, размер данных, хранящихся в таблице athena, составляет 1 ГБ .
Я хочу запросить данные таблицы на основе определенного идентификатора. таким образом, для N-го числа идентификаторов я должен сканировать N* 1 Гб объема данных.
Чтобы избежать этой ситуации и снизить затраты. Я хотел бы разбить таблицу на разделы на основе идентификатора имени столбца.
CREATE EXTERNAL TABLE `newtable`( `abc` int, `bcd` string, `cde` int, `def` int, `efg` timestamp, `egh` int) PARTITIONED BY ( `id` int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION 's3://bucket/folder'
После создания таблицы с секционированием я загружаю все разделы. Когда я пытаюсь загрузить данные.
Он показывает, что никаких записей не найдено.
Что я уже пробовал:
MSCK REPAIR TABLE seatdata_cas;