从HTML转换为WordprocessingML

问题描述

| 我有一个丰富的文本框,将其数据另存为HTML。基本上只是段落标签和简单的格式。我需要将此文本(带有格式)粘贴到以wordprocessingML格式创建的文档中。我当时在考虑使用XSLT进行转换,但据我所知。快速的Google搜索不会以示例或我不需要购买的免费形式出现太多。 有任何想法吗?     

解决方法

我今天在Google搜索html到wordprocessingml时发现了您的问题。第二个命题是使用XSLT将HTML表转换为WordProcessingML,这应该使您开始正确的道路。我仍然没有找到可以处理多种类型元素的功能齐全的样式表。 另一种方法是在文章“使用HTML和CSS动态生成MS Word文档”中找到的方法。这种方法几乎没有给HTML添加任何内容(某些XML命名空间,针对Outlook 2007的条件注释(?!)以及专有和有效CSS样式的组合),并且通过较少的处理即可产生相似的结果。但是,我在查找文档时遇到了麻烦。样式化的实体(例如“ 0”)似乎可以追溯到Office2000。这些实体上的文档(真的是Microsoft,一个解压缩CHM的可执行文件?您不应该拥有!),但是它似乎仍然有效为我在Word 2007中。