博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
将Word文档转化为HTML格式的文档
阅读量:7211 次
发布时间:2019-06-29

本文共 2689 字,大约阅读时间需要 8 分钟。

利用Word.Application提供的方法,可以很轻易地将Word文档转化为HTML等其它格式,下面就是实现的全部的代码:

Visual C#

WordToHtml.aspx

<%@ Page language="c#" Codebehind="WordToHtml.aspx.cs" AutoEventWireup="false"

 Inherits="aspxWebcs.WordToHtml" %>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >
<HTML>
  <HEAD>
    <title>WordToHtml</title>
    <meta name="GENERATOR" Content="Microsoft Visual Studio .NET 7.1">
    <meta name="CODE_LANGUAGE" Content="C#">
    <meta name="vs_defaultClientScript" content="JavaScript">
    <meta name="vs_targetSchema" content="">
  </HEAD>
  <body MS_POSITIONING="GridLayout">
    <form id="Form1" method="post" runat="server">
    </form>
  </body>
</HTML>

WordToHtml.aspx.cs

using System;

using System.Collections;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Web;
using System.Web.SessionState;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.HtmlControls;
using Office;

namespace aspxWebcs

{
/// <summary>
/// WordToHtml 的摘要说明。
/// 首先要添加引用:Microsoft Word 9.0 Object Library
/// </summary>
public class WordToHtml : System.Web.UI.Page
{
 private void Page_Load(object sender, System.EventArgs e)
 {
  // 在此处放置用户代码以初始化页面
    Word.ApplicationClass word = new Word.ApplicationClass();
    Type wordType = word.GetType();
    Word.Documents docs = word.Documents;

    // 打开文件

    Type docsType = docs.GetType();
    object fileName = "d:\\tmp\\aaa.doc";
    Word.Document doc = (Word.Document)docsType.InvokeMember("Open",
    System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});
         
    // 转换格式,另存为
    Type docType = doc.GetType();
    object saveFileName = "d:\\tmp\\aaa.html";
    //下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成:
    //docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,
     null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML});
    ///其它格式:
    ///wdFormatHTML
    ///wdFormatDocument
    ///wdFormatDOSText
    ///wdFormatDOSTextLineBreaks
    ///wdFormatEncodedText
    ///wdFormatRTF
    ///wdFormatTemplate
    ///wdFormatText
    ///wdFormatTextLineBreaks
    ///wdFormatUnicodeText
    docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,
     null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});

    // 退出 Word

    wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod,
     null, word, null);
}

#region Web 窗体设计器生成的代码

override protected void OnInit(EventArgs e)
{
 //
 // CODEGEN: 该调用是 ASP.NET Web 窗体设计器所必需的。
 //
 InitializeComponent();
 base.OnInit(e);
}

/// <summary>

/// 设计器支持所需的方法 - 不要使用代码编辑器修改
/// 此方法的内容。
/// </summary>
private void InitializeComponent()
{   
 this.Load += new System.EventHandler(this.Page_Load);
}
 #endregion
}
}

转载于:https://www.cnblogs.com/host-2008/archive/2011/04/02/2003099.html

你可能感兴趣的文章
开源社交系统ThinkSNS+和ThinkSNS V4区别在哪里
查看>>
学习编程的条件是什么?
查看>>
在linux中配置安装telnet服务
查看>>
3月第四周全球域名解析商:万网DNSPod排名均上升1名
查看>>
8月全球搜索引擎市场:百度位居第四 份额大涨
查看>>
IPsec ***数据传输过程
查看>>
(总结)Linux下多行合并成一行,中间加分隔符
查看>>
国外值得关注的网站系列之二-社交化推荐网站GetGlue
查看>>
分享无限:偷拍IBM power 720内部外部图片
查看>>
虚拟化Hadoop集群的部署和管理 - 基本操作
查看>>
PostgreSQL连接问题(Net LO problem)
查看>>
使用Timer执行定时任务
查看>>
本地安装magento无法登陆后台的问题
查看>>
期货逼仓攻略之郑商所版
查看>>
如何获得线程对象,获得Thread对象,得到线程对象,根据线程名获得线程对象,多线程取得线程对象...
查看>>
我的友情链接
查看>>
shell之sed
查看>>
esxcfg命令
查看>>
路由协议的防环
查看>>
ros中move_group的参数动态设置
查看>>