C#与EXCEL的数据交互

上一篇 / 下一篇  2010-03-31 13:50:59 / 个人分类:C#

本文假设大家已经熟悉C#对的调用,如果不熟悉,请参考MSDN中的《使用对象模型实现自动化》

一、DataTable To

先定义一下:

private .Application excelApp= new .ApplicationClass();//Application与ApplicationClass的区别我没有明白。

private .Workbook excelBook = excelApp.Workbooks.Add(Type.Missing);

private .Worksheet excelSheet = (.Worksheet)excelBook.ActiveSheet;

excelApp.Visible = true;

1、让我们看看在网上流传最多的解决方案:

public void DataTableTo(DataTable dt)

{

{

{

excelSheet.Cells[i+1,j+1] = dt.Rows[i][j].ToString();

}

}

}

不可否认这段程序会不出错误的运行,但是效率就比较低了,会随着行和列的增加而增加,主要的时间都耗在了单元格的读取上。

让我们改进一下,利用DataRow.ItemArray:

public void DataTableTo(DataTable dt)

{

colCount = dt.Columns.Count;

{

excelSheet.get_Range(excelSheet.Cells[i+1,1], excelSheet.Cells[i+1, colCount]).Value2 = dt.Rows[i].ItemArray;

}

}

这就有了很大进步,效率与列的多少已经无关了,对于这个改进我在网上还没有看到,为此我还曾沾沾自喜,但是这个方法的效率依然不高,尤其是灵活性不够。

以上效率的损失主要是每导出一条记录都要与交互一次,如果我们把准备好一次性写入是否效率更快?看如下程序:

public void DataTableTo(DataTable dt)

{

rowCount = dt.Rows.Count;

colCount = dt.Columns.Count;

object[,] dataArray = new object[rowCount,colCount];

{

{

dataArray[i, j] = dt.Rows[i][j];

}

}

excelSheet.get_Range(A1, excelSheet.Cells[rowCount, colCount]).Value2 = dataArray;

}

由于二维数组是在内存中实现,所以速度很快,由于是一次性写入到中,使我们几乎感觉不到延迟,在打开后马上就出来了,感觉很爽。

这一篇先写这些,下一篇中主要讨论一下字段标题的设置技巧,行列的筛选与排序等的技巧。

另,在上述学习过程中,我曾想能否利用dt.Rows[i].ItemArray来组建二维数组,也就是多个相同结构的一维数组简单快速的合并成一个二维数组,当然不是利用for循环。由于我初学,还是个新手,我一直没有找到相关资料,不知哪位大侠指点一下。

本文假设大家已经熟悉C#对的调用,如果不熟悉,请参考MSDN中的《使用对象模型实现自动化》

上一篇,对比了DataTable导出到中几种方式,利用二维数组的方式比较快,也是比较灵活的。有朋友说在导出的过程中需要对进行进一步的处理,那么使用二维数组的方式也是最恰当的。本篇接着上回,看看DataTable导出到中还能做些什么?

二、给DataTableTo添加些智能

1、问题提出:导出时DataTable包含了一些不需要的行,需要进行进一步的筛选;导出时不能只要,每个字段的标题还要包括。在导出到表时,有时并不是从第一行第一列开始,可能还有个XXX明细表、序号列之类的附加行列。

我的解决方案:1)、利用DataTable.Select(string filterExpression)方法进行筛选;

2)、先设置好DataTable每列的Caption,然后导出Caption即可。

3)、添加起始行列的索引参数。

还是看代码:

public void DataTableTo(DataTable dt,string sFilter, startRow, startCol)

{

DataRow drs = dt.Select(sFilter);//根据筛选条件筛选。

rowCount = drs.Length;

colCount = dt.Columns.Count;

object[,] dataArray = new object[rowCount+1,colCount];//二维数组定义是多一个标题行。

{

dataArray[0,j] = dt.Columns[j].Caption;//导出字段标题。

{

dataArray[i+1, j] = drs[i][j];

}

}

excelSheet.get_Range(excelSheet.Cells[startRow, startCol], excelSheet.Cells[rowCount+startRow, colCount+startCol-1]).Value2 = dataArray;

}

2、问题提出:很多人对长数字串(如身份证号码)导出到表时变成科学计数法或日期型字段变成了数字烦恼,网上一般给的解决方法是在数字串前加’,这是一种治标不治本的方法,不仅处理上麻烦不灵活,还不具有扩展通用性。

我的解决方案:根据DataTable中字段的类型(dt.Columns[i].DataType)设置EXCEL中相应区域的格式。

代码:

public void DataTableTo(DataTable dt,string sFilter, startRow, startCol)

{

DataRow drs = dt.Select(sFilter);//根据筛选条件筛选。

rowCount = drs.Length;

colCount = dt.Columns.Count;

object[,] dataArray = new object[rowCount+1,colCount];//二维数组定义是多一个标题行。

{

dataArray[0,j] = dt.Columns[j].Caption;//导出字段标题。

//根据各列的类型设置的格式。

switch(dt.Columns[i].DataType.ToString())

{

case System.String: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = ;

case System.DateTime: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = yyyy-mm-dd;break;

//可以根据自己的需要扩展。

default: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = G/通用格式;break;

}

{

dataArray[i+1, j] = drs[i][j];

}

}

excelSheet.get_Range(excelSheet.Cells[startRow, startCol], excelSheet.Cells[rowCount+startRow, colCount+startCol-1]).Value2 = dataArray;

}

3、问题提出:DataTable中有些列不需要导出(如自增列),有些列的前后顺序根据要求可能也不相同,怎么办?

我的解决方案:加入一个数组(如new {5,2,6,4,3,8},数组中元素表示DataTable中第几列),根据数组中列的序号和位置进行筛选和排序。

让我们扩展上面的代码:

public void DataTableTo(DataTable dt,string sFilter, startRow, startCol, columns)

{

DataRow drs = dt.Select(sFilter);//根据筛选条件筛选。

rowCount = drs.Length;

colCount = columns. Length;

object[,] dataArray = new object[rowCount+1,colCount];//二维数组定义是多一个标题行。

{

dataArray[0,j] = dt.Columns[columns[j]].Caption;//导出字段标题。

//根据各列的类型设置的格式。

switch(dt.Columns[columns[j]].DataType.ToString())

{

case System.String: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = ;

case System.DateTime: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = yyyy-mm-dd;break;

//可以根据自己的需要扩展。

default: excelSheet.get_Range(excelSheet.Cells[startRow, startCol+j], excelSheet.Cells[rowCount+startRow, startCol+j]).NumberFormatLocal = G/通用格式;break;

}

{

dataArray[i+1, j] = drs[i][columns[j]];

}

}

excelSheet.get_Range(excelSheet.Cells[startRow, startCol], excelSheet.Cells[rowCount+startRow, colCount+startCol-1]).Value2 = dataArray;

}

写道这儿,DataTableTo也算是基本满足要求了,一些个性化的功能可以根据自己的需要增加,比如,可以返回导入到最后一行的行号,方便接着导入下一个表;由于有行数限制或者某些要求一个sheet不能超过多少行,这时可以采用多个sheet分页的方式导入,这是更加深入的话题了。

以上功能的实现,都是因为工作中实际需要产生的,不是每个人都需要的,可以根据情况进行重构。

参考资料:

1、 MSDN中的《用Office编程》:

2、 MSDN中的《使用对象模型实现自动化》.


TAG:

 

评分:0

我来说两句

Open Toolbar