如何使用 SQL 表作为源填充 BIML 中的数组

问题描述

我有一个包含文件名和其他一些属性的表。我想将这些记录插入到 BIML 的数组中,以便我可以遍历这些文件(并使用附加属性导入它们)。

导入此类文件代码基本完成。 现在只需要我将下面的信息放入数组中的部分,以便我可以遍历它们。

 CREATE TABLE [config].[FilesToImport](
    [id] [int] IDENTITY(1,1) NOT NULL,[path] [nvarchar](1024) NULL,[importfilename] [nvarchar](1024) NULL,[dest_server] [nvarchar](256) NULL,[dest_db] [nvarchar](256) NULL,[dest_schema] [nvarchar](256) NULL,[refreshtype] [int] NULL,[separator] [nvarchar](5) NULL,[order] [int] NULL
) 
GO
SET IDENTITY_INSERT [config].[FilesToImport] ON 
GO
INSERT [config].[FilesToImport] ([id],[path],[importfilename],[dest_server],[dest_db],[dest_schema],[refreshtype],[separator],[order]) VALUES (1,N'c:\temp',N'FileA.csv',N'SMVPDA001',N'TEST',N'landingzone',N';',1)
GO
INSERT [config].[FilesToImport] ([id],[order]) VALUES (2,N'FileZ.csv',2)
GO
INSERT [config].[FilesToImport] ([id],[order]) VALUES (3,N'File4.cvs',3)
GO
SET IDENTITY_INSERT [config].[FilesToImport] OFF

所以基本上下面的代码应该是上面提到的表格中的文件

<Biml xmlns="http://schemas.varigence.com/biml.xsd">
    <#
    string Applicatie = "BIML";
    string Prefix = "import";
     
    string fileName;
    string path = @"c:\temp";
    string[] myFiles = Directory.GetFiles(path,"*.csv");
     
    string[] myColumns;
    #>
    <FileFormats>
    <#
    foreach (string filePath in myFiles)
    {
 
    #>
    <FlatFileFormat Name="FlatFileFormat<#=Path.GetFileNameWithoutExtension(filePath)#>" RowDelimiter="CRLF" ColumnNamesInFirstDaTarow="true" IsUnicode="false">
        <Columns>
            <# 
                 
                StreamReader myFile = new StreamReader(filePath);
                myColumns = myFile.ReadLine().Replace("\"","").Split('|');
                 myFile.Close();
                 
                // to determine the column delimeter 
                int columnCount = 0;
                string columnDelimiter = "";
                //WriteLine($"<!-- ref count {myColumns.Count} -->");
                    foreach(string myColumn in myColumns)
                    {
                    
                        columnCount++;
                        bool finalColumn = columnCount == myColumns.Length;
                        WriteLine($"<!-- actual count {columnCount} -->");
                      //  WriteLine($"<!-- what {columnCount == myColumns.Count} {finalColumn} -->");
                        
                        if (finalColumn)
                        {
                            columnDelimiter = "CRLF";
                        }
                        else
                        {
                            columnDelimiter = "|";
                        }
                        WriteLine($"<!-- delimiter {columnDelimiter} -->");
                #>
                <Column Name="<#=myColumn#>" DataType = "String" Length="250" Delimiter="<#=columnDelimiter#>"></Column>
                <# } #>
            </Columns>
        </FlatFileFormat>
            <#}#>
    </FileFormats>
    <Connections>
            <#
            foreach (string filePath in myFiles)
            {
             
            #>
            <FlatFileConnection Name="FF_CSV-<#=Path.GetFileNameWithoutExtension(filePath)#>" 
                                FilePath="<#=filePath#>" 
                                FileFormat="FlatFileFormat<#=Path.GetFileNameWithoutExtension(filePath)#>" 
             >
                 <Expressions>
                    <Expression ExternalProperty="TextQualifier">"\""</Expression>
                    <Expression ExternalProperty="RowDelimiter">"CRLF"</Expression>
                </Expressions>

            </FlatFileConnection>
            <# } #>
            <OleDbConnection
                Name="STG_<#=Applicatie#>" 
                ConnectionString="Data Source=sqlSERVER;Initial Catalog=TEST;Provider=sqlNCLI11.1;Integrated Security=sspI;Auto Translate=False;">
            </OleDbConnection>
    </Connections> 
        <Packages>
 
    <#       // Loop trough the files
            int TableCount = 0;
            foreach (string filePath in myFiles)
            { 
                TableCount++;
                fileName = Path.GetFileNameWithoutExtension(filePath);
                #>
                <Package Name="stg_<#=Prefix#>_<#=TableCount.ToString()#>_<#=fileName#>" ConstraintMode="Linear" autocreateConfigurationsType="None" ProtectionLevel="EncryptSensitiveWithPassword" PackagePassword="secret">
                    <Variables>
                        <Variable Name="CountStage" DataType="Int32" Namespace="User">0</Variable>
                    </Variables>               
                    <Tasks>
                        <Executesql ConnectionName="STG_<#=Applicatie#>" Name="sql-Truncate <#=fileName#>">
                            <DirectInput>TruncATE TABLE dbo.<#=Prefix#>_<#=fileName#></DirectInput>
                        </Executesql>
                         
                        <Dataflow Name="DFT-Transport CSV_<#=fileName#>">
                            <Transformations>
                                <FlatFileSource Name="SRC_FF-<#=fileName#> " ConnectionName="FF_CSV-<#=Path.GetFileNameWithoutExtension(filePath)#>">
                                </FlatFileSource>
                                 
                                <OleDbDestination ConnectionName="STG_<#=Applicatie#>" Name="OLE_DST-<#=fileName#>" >
                                <ExternalTableOutput Table="dbo.<#=Prefix#>_<#=fileName#>"/>
                                </OleDbDestination>
                            </Transformations>
                        </Dataflow>
                    </Tasks>
                </Package>
    <#    }    #>
 
                <!-- Create Master Package -->
                <Package Name="stg_<#=Prefix#>_0_Master" ConstraintMode="Parallel" autocreateConfigurationsType="None" ProtectionLevel="EncryptSensitiveWithPassword" PackagePassword="secret">
                    <Tasks>
                    <#  int TableCount2 = 0;
                        foreach (string filePath in myFiles)
                        { 
                                TableCount2++;
                                fileName = Path.GetFileNameWithoutExtension(filePath); #>
                 
                            <ExecutePackage Name="stg_<#=Prefix#>_<#=TableCount2.ToString()#>_<#=fileName#>">
                                <ExternalProjectPackage  Package="stg_<#=Prefix#>_<#=TableCount2.ToString()#>_<#=fileName#>.dtsx" />
                            </ExecutePackage>
                        <#
                        }
                        #>    
                    </Tasks>
                </Package>
 
    </Packages>
</Biml>
 
<!--Includes/Imports for C#-->
<#@ template language="C#" hostspecific="true"#>
<#@ import namespace="System.Data"#>
<#@ import namespace="System.IO"#>

解决方法

我看到您使用实际代码对其进行了编辑,但问题的关键在于您正在寻找 ExternalDataAccess.GetDataTable 方法。此处还提到了 Foreach datarow filter in BIML 并且奇怪的是我没有回答它...

该方法会填充一个数据表,然后您可以将其用作二维数组。 Rows 属性允许您枚举行,然后每个 DataRow 都是一个可为空的对象数组。是的,即使它在数据库中有一个类型,您也必须显式转换为其他类型才能处理数据。

<#@ import namespace="System.Data" #>
<#@ import namespace="System.Data.SqlClient" #>
<Biml xmlns="http://schemas.varigence.com/biml.xsd">
<#
// Could also pull this from this.RootNodes.Connections
string connectionStringSource = @"Server=.\dev2017;Initial Catalog=tempdb;Integrated Security=SSPI;Provider=SQLNCLI11.1;";
string query = @"SELECT
    FTI.id,FTI.path,FTI.importfilename,FTI.dest_server,FTI.dest_db,FTI.dest_schema,FTI.refreshtype,FTI.separator,FTI.defaultfieldtype,FTI.[order]
FROM
    config.FilesToImport AS FTI;";

DataTable dt = null;
dt = ExternalDataAccess.GetDataTable(connectionStringSource,query);

foreach(DataRow row in dt.Rows)
{
    // Downside to data table is everything is object so explict casts required
    WriteLine($"<!-- {row[0]},{row[1]},{row[2]} etc -->");
    
}
#>
    <FileFormats>
<#
// Enumerate through the data table to define FFCM 
foreach(DataRow row in dt.Rows)
{
#>
        <FlatFileFormat Name="SO_<#=row[0]#>" RowDelimiter="CRLF" ColumnNamesInFirstDataRow="true" IsUnicode="false"/>
<#
}
#>    
    </FileFormats>
    <Packages>
<#
// Enumerate through the data table to define packages,etc
foreach(DataRow row in dt.Rows)
{
#>
    <Package Name="Load_<#=row[5]#>_<#=row[0]#>" />
<#
}
#>    
    </Packages>
</Biml>

浏览您的代码,您可能对 CallBimlScript 或 CallBimlScriptWithOutput(我博客上的示例)感兴趣。您可以将代码分解为函数(本质上),而不是单一的 BimlScript。在 Replicate-o-matic 帖子中,我传入了一个模式和一个表,并且构建包的单个实例的所有逻辑都在那里,因此主构建器包只关心构建顶级工件 - 连接、包等,并将工作推向函数。

GetBimlScriptWithOutput 的巧妙之处在于您可以将数据返回给调用者。例如,您在创建包时正在构建包名称,并且您已经为主包重复了该逻辑以执行它们。不要重复自己。相反,让包构建器返回一个属性,即新包的名称(并添加到数组/列表中)。然后 Orchestrator 包可以简单地获取包名称,而无需知道它们是如何派生的。