Как динамически отобразить входные и выходные столбцы в SSIS?

Я должен загрузить данные в SQL Server из файлов .dbf через SSIS. Мой выходной столбец исправлен, но входной столбец не исправлен, поскольку файлы поступают от клиента, и клиент может обновлять данные в своем собственном стиле. также может быть какой-то неиспользуемый столбец или имя входного столбца может отличаться от выходного столбца.

У меня была одна идея: сопоставить входной столбец файлов с выходным столбцом в таблице базы данных SQL и использовать только те столбцы, которые присутствуют в строке для идентификатора файла.

Но я не понимаю, как это сделать. Можете ли вы предложить мне сделать то же самое, или у вас есть идеи?

Пример таблицы.

+--------+---------------+--------------+--------+ | FileID | InputColumn | OutputColumn | Active | +--------+---------------+--------------+--------+ | 1 | CustCd | CustCode | 1 | +--------+---------------+--------------+--------+ | 1 | CName | CustName | 1 | +--------+---------------+--------------+--------+ | 1 | Address | CustAdd | 1 | +--------+---------------+--------------+--------+ | 2 | Cust_Code | CustCode | 1 | +--------+---------------+--------------+--------+ | 2 | Customer Name | CustName | 1 | +--------+---------------+--------------+--------+ | 2 | Location | CustAdd | 1 | +--------+---------------+--------------+--------+

Ответ 1

Если вы создаете похожую таблицу, вы можете использовать ее в двух подходах для динамического сопоставления столбцов в пакете служб SSIS, или вы должны построить весь пакет программным способом. В этом ответе я попытаюсь дать вам некоторое представление о том, как это сделать.

(1) Создание исходной SQL-команды с псевдонимами

Примечание. Этот подход будет работать только в том случае, если все файлы .dbf имеют одинаковое количество столбцов, но имена различаются

При таком подходе вы создадите команду SQL, которая будет использоваться в качестве источника, на основе созданного вами FileID и таблицы сопоставления. Вы должны знать, что FileID и путь к файлу .dbf хранятся в переменной. как пример:

Предполагая, что имя таблицы - inputoutputMapping

Добавьте задачу "Выполнение SQL" с помощью следующей команды:

DECLARE @strQuery as VARCHAR(4000)

SET @strQuery = 'SELECT '

SELECT @strQuery = @strQuery + '[' + InputColumn + '] as [' + OutputColumn + '],'
FROM inputoutputMapping
WHERE FileID = ?

SET @strQuery = SUBSTRING(@strQuery,1,LEN(@strQuery) - 1) + ' FROM ' + CAST(? as Varchar(500))

SELECT @strQuery

И на вкладке "Сопоставление параметров" выберите переменную, которая содержит FileID, который должен быть сопоставлен с параметром 0, и переменную, которая содержит имя файла .dbf (альтернативное имени таблицы) для параметра 1

Установите тип ResultSet на Single Row и сохраните ResultSet 0 внутри переменной типа string, как пример @[User::SourceQuery]

Значение ResultSet будет следующим:

SELECT [CustCd] as [CustCode],[CNAME] as [CustName],[Address] as [CustAdd] FROM database1

В OLEDB Source выберите команду Доступ из таблицы в режим SQL из переменной и используйте переменную @[User::SourceQuery] в качестве источника.


(2) Использование компонента сценария в качестве источника

При таком подходе вы должны использовать компонент сценария в качестве источника внутри задачи потока данных:

Прежде всего, вам нужно передать путь файла .dbf и соединение SQL Server с компонентом сценария через переменные, если вы не хотите жестко их кодировать.

Внутри редактора сценариев вы должны добавить выходной столбец для каждого столбца, найденного в таблице назначения, и сопоставить их с пунктом назначения.

Внутри скрипта вы должны прочитать файл .dbf в таблицу данных:

После загрузки данных в таблицу данных также заполните другую таблицу данными, найденными в таблице MappingTable, созданной вами в SQL Server.

После этого переберите столбцы с данными и измените .ColumnName на соответствующий выходной столбец, например:

foreach (DataColumn col in myTable.Columns)
    {

    col.ColumnName = MappingTable.AsEnumerable().Where(x => x.FileID = 1 && x.InputColumn = col.ColumnName).Select(y => y.OutputColumn).First(); 

    }

После зациклите каждую строку в таблице данных и создайте строку вывода сценария.

Кроме того, обратите внимание, что при назначении выходных строк вы должны проверить, существует ли столбец, вы можете сначала добавить все имена столбцов в список строк, а затем использовать его для проверки, например:

var columnNames = myTable.Columns.Cast<DataColumn>()
                             .Select(x => x.ColumnName)
                             .ToList();  


foreach (DataColumn row in myTable.Rows){

if(columnNames.contains("CustCode"){

    OutputBuffer0.CustCode = row("CustCode");

}else{

    OutputBuffer0.CustCode_IsNull = True

}

//continue checking all other columns

}

Если вам нужна дополнительная информация об использовании компонента Script в качестве источника, перейдите по одной из следующих ссылок:


(3) Динамическое создание пакета

Я не думаю, что есть другие методы, которые вы можете использовать для достижения этой цели, за исключением того, что у вас есть выбор для динамической сборки пакета, тогда вы должны пойти дальше:


(4) SchemaMapper: библиотека классов отображения схемы С#

Недавно я начал новый проект на Git-Hub, который является библиотекой классов, разработанной с использованием С#. Вы можете использовать его для импорта табличных данных из Excel, Word, PowerPoint, Text, CSV, HTML, JSON и XML в таблицу сервера SQL с другим определением схемы с использованием подхода сопоставления схемы. проверить это по адресу:

Вы можете следить за этой страницей вики для пошагового руководства: