Как загрузить неформатированный плоский файл с неравномерным интервалом в качестве разделителя и двумя заголовками в ssis?
Привет,
Я получил задание загрузить странно отформатированный текстовый файл. Файл также содержит нежелательные данные. Файл содержит два заголовка спина к спине, и данные для каждого заголовка задаются в альтернативной строке.Строки заголовка начинаются после ( - - - - - -). Нужно прочитать оба заголовка вместе с соответствующими данными и сбросить их в какой-нибудь пункт назначения excel/таблицы с помощью. Дайте мне знать, как решить эту проблему с помощью любого преобразования в ssis или, возможно, с помощью скрипта.
Не знаю, как использовать script task для этого.
Данные файла:
PAGE 2 BATCH ABC PAYMENT DATE & DUE DATE EDIT PAGE 481 ------------------------------------------------------------------------------------------------------------------------------------ SEO XRAT CLT LOAN OPENING PAYMENT MATURIUH LOAN NEXE ORIG-AMT OFF TO CATE CONTC MON NO.TO TOL NEL S CUP CO IND PAT NOM CODE NOM NOMTER DATE DUO DATE DATE TIME PT # MONEY AQ LOAN NUMBER BLOCK PAYMENT U TYP GH OMG IND 1-3 4-6 7-13/90-102 14-19 20-25 26-31 32-34 35-37 38-46 47-48 49 50-51 52-61 62 63 64-72 73 4-5 76 77 8-80 ------------------------------------------------------------------------------------------------------------------------------------ SEO XRAT CLT LOAN A/C A/C MIN MAX MAX PENDI LATE CCH L/F PARTLYS CUR L/F L/F L/F NOM CODE NOM NOMTER CODE FACTOR MON MON ROAD DAYS MONE POT L/A L/F JAC INT VAD CD USED PI VAD DT 1-3 4-6 7-13/90-102 14 15 20-23 24-29 30-34 35-37 38-42 43 44 49 60 61-63 64-69 USED-ID: ------------------------------------------------------------------------------------------------------------------------------------ 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55 025641 055 123 5144511352 B .55321 2.55 6531.22 H #AS 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55 025641 055 123 5144511352 B .55321 2.55 6531.22 H #AS 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55 025641 055 123 5144511352 B .55321 2.55 6531.22
Вывод будет содержать два файла:
Файл1:
SEO XRAT CLT LOAN OPENING PAYMENT MATURIUH LOAN NEXE ORIG-AMT OFF TO CATE CONTC MON NO.TO TOL NEL S CUP CO IND PAT NOM CODE NOM NOMTER DATE DUO DATE DATE TIME PT # MONEY AQ LOAN NUMBER BLOCK PAYMENT U TYP GH OMG IND 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55 454542 070 567 2136547895 08-08-18 08-06-18 11-02-18 123 256 62,222 LK 5 55 5463218975 5 3 5,555.22 33 H55
Файл 2:
SEO XRAT CLT LOAN A/C A/C MIN MAX MAX PENDI LATE CCH L/F PARTLYS CUR L/F L/F L/F NOM CODE NOM NOMTER CODE FACTOR MON MON ROAD DAYS MONE POT L/A L/F JAC INT VAD CD USED PI VAD DT 025641 055 123 5144511352 B .55321 2.55 6531.22 H #AS 025641 055 123 5144511352 B .55321 2.55 6531.22 H #AS 025641 055 123 5144511352 B .55321 2.55 6531.22 H #AS
Что я уже пробовал:
Прямо сейчас я читаю файл в одном столбце и с помощью производного столбца вручную пытаюсь разделить его с помощью функции подстроки. Но это работает только для одного заголовка, и это слишком жестко закодированный тип. Нужен какой-то динамический подход для чтения строк заголовка, а также строк данных непосредственно.